Funzione di verosimiglianza

Da Wikipedia, l'enciclopedia libera.

La funzione di verosimiglianza in statistica è una funzione di probabilità condizionata, considerata come funzione del suo secondo argomento, mantenendo fissato il primo argomento.

Introduzione[modifica | modifica sorgente]

In gergo colloquiale spesso "verosimiglianza" è usato come sinonimo di "probabilità", ma in campo statistico vi è una distinzione tecnica precisa. Questo esempio chiarisce la differenza tra i due concetti: una persona potrebbe chiedere "Se lanciassi una moneta non truccata 100 volte, qual è la probabilità che esca testa tutte le volte?" oppure "Dato che ho lanciato una moneta 100 volte ed è uscita testa 100 volte, qual è la verosimiglianza (likelihood) che la moneta sia truccata?". Invertire nelle due frasi verosimiglianza e probabilità sarebbe errato.

Una distribuzione di probabilità che dipende da un parametro si potrebbe considerare in due modi differenti: Il primo interpreta la distribuzione di probabilità come una funzione del risultato, dato un valore fissato del parametro mentre il secondo la interpreta come una funzione del parametro, dato un risultato fissato. Nell'ultimo caso la funzione è chiamata "funzione di verosimiglianza" del parametro, e indica quanto verosimilmente il valore di un parametro è corretto rispetto al risultato osservato.

Definizione[modifica | modifica sorgente]

Formalmente la funzione di verosimiglianza è una funzione:

\ b\mapsto P(A|B=b)

si definisce ancora funzione di verosimiglianza ogni funzione proporzionale a tale probabilità. Dunque, la funzione di verosimiglianza per \ B è la classe delle funzioni:

\ \mathcal{L}(b|A)=\alpha P(A|B=b),

per ogni costante \ \alpha>0. A causa di ciò, l'esatto valore di \ \mathcal{L}(b|A) non è in generale rilevante; ciò che rileva sono rapporti nella forma: \ \mathcal{L}(b_{2}|A)/\mathcal{L}(b_{1}|A), invarianti rispetto alla costante di proporzionalità.

A livello interpretativo, l'uso di una funzione di verosimiglianza trae giustificazione dal teorema di Bayes, in base al quale, per due qualsiasi eventi \ A e \ B:

\ P(B|A)=\frac{P(A|B)P(B)}{P(A)}

dove sia \ P(A|B) che \ \frac{P(A|B)}{P(A)} sono funzioni di verosimiglianza. L'uso di funzioni di verosimiglianza ai fini dell'inferenza statistica costituisce un tratto distintivo dell'inferenza classica, o frequentista; esso rappresenta inoltre una fondamentale differenza rispetto alla scuola dell'inferenza bayesiana, in quanto lo statistico bayesiano conduce inferenza tramite la probabilità \ P(B|A) nell'espressione sopra.

Cenni storici[modifica | modifica sorgente]

Alcune idee relative alla funzione di verosimiglianza sembrano essere state introdotte da T. N. Thiele in un lavoro del 1889. Il primo contributo in cui il concetto di funzione di verosimiglianza è esplicitamente formulato è tuttavia dovuto a Ronald Fisher ("On the mathematical foundations of theoretical statistics", 1922). In tale lavoro, Fisher usa inoltre l'espressione metodo della massima verosimiglianza; argomenta inoltre contro il ricorso alla condizionata nella forma \ P(B|A) nell'espressione sopra, da lui ritenuta ingiustificabile a causa dell'elemento di soggettività introdotto tramite la probabilità a priori (nel linguaggio che ora è proprio della statistica bayesiana) \ P(B).

Funzione di verosimiglianza per un modello parametrico[modifica | modifica sorgente]

Il metodo della massima verosimiglianza ha le sue applicazioni più rilevanti nella prassi come metodo di stima di modelli parametrici. Considerando un insieme di osservazioni \ \left\{x_{i}\right\}_{i=1}^{n}, e una famiglia di funzioni di densità (o di massa, nel caso di distribuzioni discrete), parametrizzate tramite il vettore \ \vartheta:

\ x\mapsto f(x|\vartheta)

la funzione di verosimiglianza associata è:

\ \mathcal{L}\left(\vartheta|\left\{x_{i}\right\}_{i=1}^{n}\right)=f\left(\left\{x_{i}\right\}_{i=1}^{n}|\vartheta\right)

Nel caso in cui, come normalmente si ipotizza, gli \ x_i siano indipendenti e identicamente distribuiti, inoltre:

\ \mathcal{L}\left(\vartheta|\left\{x_{i}\right\}_{i=1}^{n}\right)=\prod_{i=1}^{n}f(x_{i}|\vartheta)

Poiché l'espressione sopra può risultare scarsamente trattabile, specie nei problemi di massimizzazione collegati al metodo della massima verosimiglianza, spesso risulta preferibile lavorare sul logaritmo della funzione di verosimiglianza, in gergo chiamata log-verosimiglianza:

\ L\left(\vartheta|\left\{x_{i}\right\}_{i=1}^{n}\right)=\ln\mathcal{L}\left(\vartheta|\left\{x_{i}\right\}_{i=1}^{n}\right)=\sum_{i=1}^{n}\ln f\left(x_{i}|\vartheta\right)

Bibliografia[modifica | modifica sorgente]

Voci correlate[modifica | modifica sorgente]

matematica Portale Matematica: accedi alle voci di Wikipedia che trattano di matematica