Efficienza (statistica)

Da Wikipedia, l'enciclopedia libera.

In statistica, l'efficienza è una misura di desiderabilità di uno stimatore. L'efficienza di una statistica corretta \ T per un parametro \ \vartheta è definita come:

\ e(T)=\frac{1/\mathcal{I}(\vartheta)}{\textrm{var}(T)}

dove \ \mathcal{I}(\vartheta) è l'informazione di Fisher del campione; \ e(T) è uguale al rapporto tra la minima varianza possibile per uno stimatore di \ \vartheta e la sua varianza effettiva. La disuguaglianza di Cramér-Rao implica che \ e(T)\leq 1.

Stimatore efficiente[modifica | modifica wikitesto]

Se uno stimatore di un parametro \vartheta \in \Theta è tale che \ e(T) = 1 per tutti i possibili valori del parametro, lo stimatore si dice efficiente (in senso assoluto). In termini equivalenti, uno stimatore è detto efficiente (in senso assoluto) se la sua varianza raggiunge il limite inferiore di Cramér-Rao \ \forall\ \vartheta\in\Theta.

Se uno stimatore efficiente (in senso assoluto) è anche corretto, esso è uno stimatore MVUE, o stimatore corretto di varianza minima (dall'inglese Minimum Variance Unbiased Estimator). Questo perché, chiaramente, nessuno stimatore corretto alternativo potrà essere caratterizzato da una varianza minore. È interessante osservare che, per contro, uno stimatore corretto di varianza minima (MVUE) non è necessariamente efficiente in senso assoluto: potrebbe infatti esistere uno stimatore distorto la cui varianza raggiunge il limite inferiore di Cramér-Rao.

Efficienza asintotica[modifica | modifica wikitesto]

Alcuni stimatori conseguono l'efficienza in senso assoluto soltanto asintoticamente, ossia se la dimensione del campione di cui sono funzione tende all'infinito. Si parla in tal caso di stimatori asintoticamente efficienti. Questo è il caso, ad esempio, degli stimatori di massima verosimiglianza.

Esempi[modifica | modifica wikitesto]

Si consideri un campione di dimensione \ n estratto da una popolazione normale con valore atteso \ \mu e varianza unitaria (ossia, x_i \sim \mathcal{N}(\mu, 1),\ i=1,\ldots,n).

La media campionaria \overline{x} del campione x_1, x_2, \ldots, x_i, definita come:


\overline{x} = \frac{1}{n} \sum_{i=1}^{n} x_i

ha varianza pari a \ \frac{1}{n}. Questo valore è uguale al reciproco dell'informazione di Fisher del campione, e dunque, per la disuguaglianza di Cramér-Rao, la media campionaria è uno stimatore efficiente in senso assoluto.

Si consideri ora la mediana campionaria; essa è uno stimatore distorto, ma consistente per \ \mu. In particolare, per \ n\rightarrow\infty la mediana campionaria ha distribuzione approssimativamente normale, con valore atteso \ \mu e varianza \ \frac{\pi}{2n}. La sua efficienza è dunque all'incirca 0.64. Si osservi inoltre che questa è una misura dell'efficienza asintotica; in campioni ridotti (valori finiti di \ n) l'efficienza è in effetti maggiore (ad esempio, per \ n=3 si ha un'efficienza di circa 0.74). Si osservi inoltre che in certe applicazioni la mediana è preferita alla media, sulla base che la sua maggiore robustezza (minore sensibilità alla presenza di valori anomali nel campione) compenserebbe la minore efficienza.

Efficienza relativa[modifica | modifica wikitesto]

Si considerino due statistiche campionarie, \ T_1 e \ T_2, stimatori per il parametro \ \vartheta; il senso comune suggerisce che \ T_1 è «più efficiente» di \ T_2 se:

  1. il suo errore quadratico medio (o MSE, dall'inglese Mean Squared Error) non eccede quello di \ T_2 per ogni possibile valore assunto da \ \vartheta\in\Theta;
  2. lo MSE è minore per almeno un valore di \ \vartheta\in\Theta.

Formalmente,


\mathrm{E}\left[(T_1 - \vartheta)^2\right]\leq\mathrm{E}\left[ (T_2-\vartheta)^2\right]

\ \forall\ \vartheta\in\Theta, ed \ \exists\ \vartheta_0\in\Theta tale che valga la disuguaglianza stretta.

L'efficienza relativa di \ T_1 rispetto a \ T_2 è allora definita da:


e(T_1,T_2,\vartheta)=\frac {\mathrm{E} \left[ (T_1-\vartheta)^2 \right]}{\mathrm{E} \left[ (T_2-\vartheta)^2\right]}

Sebbene e(\cdot) sia in generale una funzione di \vartheta, spesso ciò non è verificato; in tal caso, un valore di e(\cdot) minore di 1 indicherebbe che lo stimatore \ T_1 è preferibile (più efficiente), a prescindere dal vero valore di \ \vartheta.

Voci correlate[modifica | modifica wikitesto]

matematica Portale Matematica: accedi alle voci di Wikipedia che trattano di matematica