Score (statistica)

Da Wikipedia, l'enciclopedia libera.

In statistica, il termine score indica il gradiente (il vettore delle derivate parziali) del logaritmo della funzione di verosimiglianza.

In termini formali, data l'osservazione X con funzione di verosimiglianza L(\theta;X), lo score V è dato da:

V = \frac{\partial}{\partial\theta} \log L(\theta;X) = \frac{1}{L(\theta;X)} \frac{\partial L(\theta;X)}{\partial\theta}.

V è una funzione di \theta (i parametri da stimare) e X (le osservazioni).

Proprietà[modifica | modifica sorgente]

Media[modifica | modifica sorgente]

Sotto alcune condizioni di regolarità, il valore atteso di V rispetto all'osservazione x condizionato a \theta (\mathbb{E}(V|\theta)) è nullo.

Riscrivendo la funzione di veromiglianza come funzione di densità (L(\theta; x) = f(x; \theta)), si ha infatti:

\mathbb{E}(V|\theta) =  \int_{x=-\infty}^{+\infty} \left ( \frac{\partial}{\partial\theta} \log f(x;\theta)
\right ) f(x; \theta) dx = \int_{x=-\infty}^{+\infty}
 \frac{\frac{\partial f(x; \theta)}{\partial \theta}}{f(x; \theta)} f(x; \theta)
dx

da cui, semplificando otteniamo:

\mathbb{E}(V|\theta) =
\int_{x=-\infty}^{+\infty} \frac{\partial f(x; \theta)}{\partial \theta} \, dx =
\frac{\partial}{\partial\theta} \int_{x=-\infty}^{+\infty}
 f(x; \theta) \, dx =
\frac{\partial}{\partial\theta}1 = 0.

Varianza[modifica | modifica sorgente]

Exquisite-kfind.png Per approfondire, vedi Informazione di Fisher.

La varianza dello score è l'informazione di Fisher: \mathcal{I}(\theta).

Poiché il valore atteso dello score è nullo, la varianza dello score è data da:


\mathcal{I}(\theta)
=
\mathbb{E}
\left\{\left.
 \left[
  \frac{\partial}{\partial\theta} \log L(\theta;X)
 \right]^2
\right|\theta\right\}.

Voci correlate[modifica | modifica sorgente]