Disuguaglianza di Cramér-Rao
In statistica, la disuguaglianza di Cramér-Rao, che prende il nome da Harald Cramér e Calyampudi Radhakrishna Rao, afferma che il reciproco della matrice informazione di Fisher
per un parametro
costituisce un limite inferiore alla varianza di uno stimatore corretto per il parametro (denotato
):
In alcuni casi, non esiste uno stimatore corretto che consegue il limite inferiore così stabilito.
Non è infrequente trovare riferimenti alla disuguaglianza di Cramér-Rao come al limite inferiore di Cramér-Rao.
Si ritiene che il matematico francese Maurice René Fréchet fu il primo a scoprire e dimostrare questa disuguaglianza.[1]
Indice |
Condizioni di regolarità [modifica]
La disuguaglianza di Cramér-Rao si fonda su due deboli condizioni di regolarità che caratterizzano la funzione di densità
, e lo stimatore adottato,
. Tali condizioni richiedono che:
- L'informazione di Fisher sia sempre definita; ciò equivale a richiedere che, per ogni
tale che
,
- Le operazioni di integrazione rispetto a
e di derivazione rispetto a
possano essere scambiate all'interno del valore atteso dello stimatore
, ossia:
- ogniqualvolta il secondo membro della relazione sopra è finito.
Laddove la seconda condizione di regolarità è estesa al secondo ordine di derivazione, è possibile esprimere la disuguaglianza tramite una forma alternativa dell'informazione di Fisher, così che il limite inferiore di Cramér-Rao è dato da:
In alcuni casi, può risultare più semplice applicare la disuguaglianza nella forma testé espressa.
Si osservi che uno stimatore non corretto potrà avere una varianza o uno scarto quadratico medio inferiore al limite di Cramér-Rao; questo perché la disuguaglianza è riferita esclusivamente a stimatori corretti.
Dimostrazione [modifica]
La dimostrazione della disuguaglianza di Cramér-Rao passa attraverso la verifica di un risultato più generale; per un qualsiasi stimatore (statistica di un campione
)
, il cui valore atteso è denotato da
, e per ogni
:
La disuguglianza di Cramér-Rao discende direttamente da quest'ultima relazione, come caso particolare.
Sia dunque
una variabile casuale, avente funzione di densità
.
è una statistica utilizzata come estimatore del parametro
. Sia inoltre
il suo score, o derivata logaritmica rispetto a
:
Il valore atteso
è nullo. Ciò a sua volta implica che
. Espandendo quest'ultima espressione, si ha:
Svolgendo la derivata tramite la regola della catena:

e conoscendo la definizione di speranza matematica:
dal momento che gli operatori di derivazione e integrazione commutano.
Tramite la disuguaglianza di Cauchy-Schwarz si ha inoltre:
dunque:
come volevasi dimostrare. Ora, se
è uno stimatore corretto per
,
, e
; dunque la relazione sopra diviene:
ossia la disuguaglianza di Cramér-Rao.
Estensione a più parametri [modifica]
Al fine di estendere la disuguaglianza di Cramér-Rao al caso di un vettore di parametri, si definisca il vettore colonna:
e sia ad esso associata una funzione di densità
che soddisfi le condizioni di regolarità elemento per elemento.
L'informazione di Fisher
è allora una matrice di dimensioni
, il cui generico elemento
è definito da:
La disuguaglianza di Cramér-Rao è dunque formulata come:
dove:
e
è una matrice semidefinita positiva, ossia tale per cui
.
Se
è uno stimatore corretto, e dunque
, la disuguaglianza di Cramér-Rao è:
La disuguaglianza stessa è da intendersi nel senso che la differenza tra il primo e il secondo membro è ancora una matrice semidefinita positiva.
Disuguaglianza di Cramér-Rao ed efficienza [modifica]
La disuguaglianza di Cramé-Rao è strettamente legata al concetto di efficienza di uno stimatore. In particolare, è possibile definire una misura di efficienza per uno stimatore
per il parametro (o vettore di parametri)
, come:
ossia la minima varianza possibile per uno stimatore corretto, basata sulla disuguaglianza di Cramér-Rao, rapportata all'effettiva varianza. In base alla disuguaglianza di Cramér-Rao, ovviamente
.
Illustrazione del risultato [modifica]
Si illustra il significato della disuguaglianza di Cramér-Rao tramite un esempio basato sulla variabile casuale normale multivariata. Sia un vettore aleatorio
, tale che:
dove
denota la distribuzione normale; la funzione di densità multivariata associata è:
La matrice informazione di Fisher ha generico elemento
:
dove
denota l'operatore traccia di una matrice.
Si consideri caso di un vettore aleatorio gaussiano come sopra, di dimensione
, con media nulla ed elementi indipendenti aventi ciascuno varianza
:
La matrice informazione di Fisher è allora
:
Dunque il limite inferiore di Cramér-Rao per la varianza di uno stimatore
per
è dato da:
Giova osservare che tale limite è pari alla varianza teorica dello stimatore di massima verosimiglianza per il parametro
nelle ipotesi presentate.
Note [modifica]
- ^ Wiebe R. Pestman, Mathematical Statistics: An Introduction, Walter de Gruyter, 1998, ISBN 3-11-015357-2, p. 118.
Bibliografia [modifica]
- D.C. Boes, F.A. Graybill, A.M. Mood (1988), Introduzione alla Statistica, McGraw-Hill Libri Italia, ISBN 88-386-0661-7, un testo di riferimento per i fondamenti della statistica matematica; la disuguaglianza di Cramér-Rao è trattata nei capitoli sui metodi di ricerca degli stimatori.
- Alexander Craig Aitken e H. Silverstone, "On the Estimation of Statistical Parameters", in Proceedings of the Royal Society of Edinburgh, 1942, vol. 61, pp. 186-194, dove gli autori sviluppano idee di Ronald Fisher descrivendo un caso particolare di quella che sarebbe diventate la Disuguaglianza di Cramèr-Rao
Voci correlate [modifica]
- Efficienza (statistica)
- Informazione di Fisher
- Metodo della massima verosimiglianza
- Metodo dei momenti
|
|
![\ \mbox{var}\left(\hat{\vartheta}\right)\geq\frac{1}{\mathcal{I}(\vartheta)}=\frac{1}{\mbox{E}\left[\left(\frac{\partial}{\partial\vartheta}\ln f(X;\vartheta)\right)^{2}\right]}](http://upload.wikimedia.org/math/a/e/5/ae5fceae57160f7459c6cd1733520e33.png)
tale che
,
![\ \frac{\partial}{\partial\vartheta}\left[\int T(x)f(x;\vartheta)dx\right]=\int T(x)\left[\frac{\partial}{\partial\vartheta}f(x;\vartheta)\right]dx](http://upload.wikimedia.org/math/b/7/d/b7d22f25a53b07235b844c9ad0377565.png)
![\ \mbox{var}\left({\hat{\vartheta}}\right)\geq\frac{1}{\mathcal{I}(\vartheta)}=\frac{1}{-\mbox{E}\left[\frac{\partial^{2}}{\partial\vartheta^{2}}\ln f(X;\vartheta)\right]}](http://upload.wikimedia.org/math/5/5/7/557599077ce410171d7cfed6f2c26864.png)
![\ \mbox{var}(t(X))\geq\frac{\left[\psi'(\vartheta)\right]^{2}}{\mathcal{I}(\vartheta)}](http://upload.wikimedia.org/math/f/4/d/f4d0f39a529edc5b93f29de8daf373ff.png)


![\ \mbox{E}\left(T\frac{\partial}{\partial\vartheta}\ln f(X;\vartheta)\right)=\int t(x)\left[\frac{\partial}{\partial\vartheta}f(x;\vartheta)\right]dx=\frac{\partial}{\partial\vartheta}\left[\int t(x)f(x;\vartheta)dx\right]=\psi'(\vartheta)](http://upload.wikimedia.org/math/1/8/8/1881fbf140726da155f475cf8bd89bb0.png)

![\ \mbox{var}(T)\geq\frac{\left[\psi'(\vartheta)\right]^{2}}{\mbox{var}(V)}=\frac{\left[\psi'(\vartheta)\right]^{2}}{\mathcal{I}(\vartheta)}=\left[\frac{\partial}{\partial\vartheta}\mbox{E}(T)\right]^{2}\frac{1}{\mathcal{I}(\vartheta)}](http://upload.wikimedia.org/math/e/7/f/e7f6552d2f2d648e4245c8da5f31b4ad.png)

![\boldsymbol{\theta} = \left[ \vartheta_1, \vartheta_2, \dots, \vartheta_d \right]' \in \mathbb{R}^d](http://upload.wikimedia.org/math/c/5/0/c507db46462b21fc90c0f9bf4a042a17.png)
![\ \mathcal{I}_{m, k} =\mbox{E}\left[
\frac{\partial}{\partial\vartheta_m} \ln f\left(x; \boldsymbol{\theta}\right)
\frac{\partial}{\partial\vartheta_k} \ln f\left(x; \boldsymbol{\theta}\right)
\right]](http://upload.wikimedia.org/math/a/6/1/a61bdb4b32d131f222b447b860c7ffb7.png)


![\boldsymbol{\psi}
=
\mathrm{E}\left[\boldsymbol{T}(X)\right]
=
\begin{bmatrix} \psi_1\left(\boldsymbol{\theta}\right) &
\psi_2\left(\boldsymbol{\theta}\right) &
\cdots &
\psi_d\left(\boldsymbol{\theta}\right)
\end{bmatrix}'](http://upload.wikimedia.org/math/a/b/5/ab5ae9cd2f636e21a3770fb70dbf95b8.png)









