Test chi quadrato

Da Wikipedia, l'enciclopedia libera.

Con test chi quadrato si intende uno dei test di verifica d'ipotesi usati in statistica che utilizzano la variabile casuale Chi Quadrato per verificare se l'ipotesi nulla è probabilisticamente compatibile con i dati. A seconda delle ipotesi di partenza usate per costruire il test, tali test vengono considerati a volte parametrici e altre volte non parametrici.

I risultati ottenuti nei campioni non sempre concordano esattamente con i risultati teorici attesi secondo le regole di probabilità, anzi, è ben raro che questo si verifichi. Per intenderci, benché considerazioni teoriche ci portino ad attenderci 50 teste e 50 croci da 100 lanci di una moneta, è raro che questi risultati siano ottenuti esattamente, ma nonostante questo non si deve per forza dedurre che la moneta sia truccata. Supponiamo che in un particolare campione si sia osservato che un insieme di possibili eventi E1, E2, …, Ek si presenta con frequenze o1, o2, …, ok dette frequenze osservate, e che, secondo le regole della probabilità, ci si attenda che si presenti con frequenze e1, e2, …, ek dette frequenze teoriche o attese:

Evento E1 E2 ... Ek
Frequenze osservate o1 o2 ... ok
Frequenze attese e1 e2 ... ek

Lo scopo del test χ² è quello di conoscere se le frequenze osservate differiscono significativamente dalle frequenze teoriche.

Se χ² = 0, le frequenze osservate coincidono esattamente con quelle teoriche. Se invece χ² > 0, esse differiscono. Più grande è il valore di χ², più grande è la discrepanza tra le frequenze osservate e quelle teoriche. Nella pratica le frequenze teoriche vengono calcolate sulla base di un’ipotesi H0. Se sulla base di questa ipotesi il valore calcolato di χ² è più grande di un certo valore critico (come 20.95 o 20.99, che sono i valori critici rispettivamente ai livelli di significatività 5 % e 1 %), dovremmo concludere che le frequenze osservate differiscono significativamente dalle frequenze attese e dovremmo rifiutare H0 al corrispondente livello di significatività. Altrimenti dovremmo accettarla, o almeno non rifiutarla. Tale procedimento è chiamato test chi-quadrato dell’ipotesi.

Bisognerebbe notare che si deve guardare con sospetto a circostanze in cui χ² è troppo vicino allo zero, poiché è raro che le frequenze osservate concordino troppo bene con le frequenze teoriche. Per esaminare tali situazioni, possiamo determinare se il valore calcolato di χ² è minore di 20.05 o di 20.01 nel qual caso dovremmo concludere che l’accostamento è troppo buono ai livelli di significatività del 5 % e 1 % rispettivamente.

Per conoscere i valori critici di χ² ad un determinato livello di significatività e con gli opportuni gradi di libertà ci si può avvalere di tabelle, oppure si possono calcolare numericamente partendo dalla corrispondente istanza della distribuzione χ² e calcolandone l’integrale nell’opportuno intervallo che dipenderà dal livello di significatività scelto.

Tra i test chi quadrato si possono elencare:

  • Test chi quadrato di Pearson
  • il test chi quadrato di Yates, ovvero la correzione di Yates per la continuità
  • il test chi quadrato di Mantel-Haenszel

nonché diversi test che in determinate situazioni (solitamente quando si è in presenza di molti dati) fanno ricorso alla v.c. Chi Quadrato come distribuzione approssimativa