Wald test

Da Wikipedia, l'enciclopedia libera.

Il Wald test è una prova statistica, usata tipicamente per esaminare se un effetto esiste oppure no. Cioè esamina se una variabile indipendente ha un rapporto statisticamente significativo con la variabile dipendente.

Si supponga che un economista, che ha un database contenente classe sociale e numero di scarpe, voglia vedere se le due cose abbiano una relazione.

Sia θ l'aumento medio nel numero delle scarpe per gli appartenenti alla classe alta confrontata alla gente classe media: allora la prova del Wald test può essere usata per esaminare se θ è 0 (nel qual caso la classe sociale non ha associazione con la misura delle scarpe) o non-zero (il numero di scarpe varia fra le classi sociali).

O, per un esempio medico, supponga che fumando moltiplica il rischio di cancro polmonare per un certo numero R: allora la prova di Wald può essere usata per esaminare se R = 1 (cioè non c'è effetto di fumare) o è più grande (o di meno) che 1 (cioè fumare altera il rischio).

Una prova di Wald può essere usata in una varietà grande di modelli differenti compresi i modelli per le variabili dicotomiche ed i modelli per le variabili continue. [1].

Dettagli matematici[modifica | modifica sorgente]

Nel test di Wald (così chiamato dal suo ideatore Abraham Wald) la stima di massima verosimiglianza \hat\theta del parametro di interesse \theta è confrontata con un valore proposto, \theta_0, sotto l'assunzione che la differenza tra le due avrà una distribuzione che si può approssimare con una normale. Tipicamente, il quadrato delle differenze viene confrontato con una distribuzione Chi-quadro. Nel caso univariato, la statistica di Wald è:


\frac{ ( \widehat{ \theta}-\theta_0 )^2 }{\operatorname{var}(\hat \theta )}

che viene confrontato con una Chi quadro.

In alternativa, la differenza può essere confrontata con la distribuzione normale. In questo caso la statistica test è

\frac{\widehat{\theta}-\theta_0}{\operatorname{se}(\hat\theta)}

dove \operatorname{se}(\widehat\theta) è l'errore standard della stima di massima verosimiglianza. Una stima ragionevole dell'errore standard per lo stimatore di massima verosimiglianza (MLE) può essere data da  \frac{1}{\sqrt{I_n(MLE)}} , essendo  I_n l'informazione di Fisher del parametro.

Nel caso multivariato, un test su più parametri contemporaneamente è realizzato usando una matrice di varianze e covarianze[2]. Un uso comune è quello di eseguire un test di Wald su di una variabile categorica reinterpretandola come un insieme di variabili dicotomiche.

Alternative al test di Wald[modifica | modifica sorgente]

Anche il test del rapporto di verosimiglianza può essere usato per verificare se sussista o meno un determinato effetto. Solitamente il test di Wald e quello del rapporto di verosimiglianza portano a conclusioni molto simili (poiché sono asintoticamente equivalenti) ma, molto raramente, essi differiscono abbastanza da portare a conclusioni differenti: il ricercatore si può trovare in una situazione in cui il p-value sia significativo quando l'intervallo di confidenza include lo 0, oppure il p-value non sia significativo quando l'intervallo di confidenza esclude lo zero. In questa situazione occorre ricordare che la significatività statistica è sempre un concetto in qualche modo arbitrario, dal momento che essa dipende dal livello di significatività scelto.

Ci sono alcune ragioni per preferire il test di verosimiglianza rispetto al test di Wald[3] [4] [5]. Una di esse è che il test di Wald può fornire risposte differenti allo stesso problema, a seconda di come la domanda è formulata[6]. Per esempio, chiedersi se R=1 dovrebbe essere lo stesso che chiedersi se logR=0. Eppure la statistica di Wald per R=1 non è la stessa di quella che si ottiene per logR=0 (poiché, in generale, non c'è alcuna relazione tra gli errori standard di R e quelli di log R). Il test del rapporto di verosimiglianza darà invece lo stesso risultato, sia che noi lavoriamo con R, log R o qualsiasi altra trasformazione di R. Un'altra ragione di ciò è che il test di Wald ricorre a due assunzioni (che noi conosciamo l'errore standard, e che la distribuzione sia una Chi-quadro), mentre il test del rapporto di verosimiglianza ricorre ad una sola assunzione (che la distribuzione sia una Chi-quadro).

Un'ulteriore alternativa è lo "score test", che possiede il vantaggio di poter essere formulato in situazioni in cui la variabilità è difficile da stimare; il test di Cochran-Mantel-Haenzel è un esempio di "score test"[7].

Note[modifica | modifica sorgente]

  1. ^ Frank E Harrell Jr (2001), Regression modeling strategies, Springer-Verlag, Sections 9.2, 10.5
  2. ^ Frank E Harrell Jr (2001), Regression modeling strategies, Springer-Verlag, Section 9.3.1
  3. ^ Frank E Harrell Jr (2001), Regression modeling strategies, Springer-Verlag, Section 9.3.3
  4. ^ David Collett, Modelling survival data in medical research, Chapman & Hall
  5. ^ Yudi Pawitan (2001), In all likelihood, Oxford University Press
  6. ^ Fears et al. (1996) A reminder of the fallibility of the Wald statistic. The American Statistician 50:226-7.
  7. ^ Alan Agresti (2002), "Categorical Data Analysis", Wiley, p. 232

Voci correlate[modifica | modifica sorgente]