Test chi quadrato

Da Wikipedia, l'enciclopedia libera.

Con test chi quadrato si intende uno dei test di verifica d'ipotesi usati in statistica che utilizzano la distribuzione della variabile casuale Chi Quadrato per decidere se rifiutare o non rifiutare l'ipotesi nulla. A seconda degli assunti di partenza usati tali test vengono considerati parametrici o non parametrici.

Il test chi quadrato è ampiamente utilizzato per verificare che le frequenze dei valori osservati si adattino alle frequenze teoriche di una distribuzione di probabilità prefissata. Per intenderci, benché si possa dedurre che il risultato di 100 lanci di una moneta segua la distribuzione uniforme, è raro che si ottengano esattamente 50 teste e 50 croci, il test chi quadrato ci consente di stabilire (dopo aver fissato l'errore massimo tollerato) se le discrepanze tra le frequenze osservate e quelle teoriche sono imputabili completamente al caso o se invece è lecito supporre che la moneta sia truccata.

Definizione:[modifica | modifica wikitesto]

Supponiamo che in un particolare campione si sia osservato che un insieme di possibili eventi E1, E2, …, Ek si presenta con frequenze o1, o2, …, ok dette frequenze osservate, e che, secondo le regole della probabilità, ci si attenda che si presenti con frequenze e1, e2, …, ek dette frequenze teoriche o attese:

Evento E1 E2 ... Ek
Frequenze osservate o1 o2 ... ok
Frequenze attese e1 e2 ... ek

La variabile test \chi^2
si ottiene sommando, per ogni evento Ei il quadrato degli scarti tra le frequenze teoriche e quelle osservate pesato sulle frequenze teoriche:

\chi^2 = \sum_{i=1}^k {(o_i - e_i)^2 \over e_i}

che si distribuisce come una variabile \chi^2 con (k-1) gradi di libertà.

Se χ² = 0, le frequenze osservate coincidono esattamente con quelle teoriche. Se invece χ² > 0, esse differiscono. Più grande è il valore di χ², più grande è la discrepanza tra le frequenze osservate e quelle teoriche.

Esempio[1][modifica | modifica wikitesto]

Un dado viene lanciato 2000 volte con i seguenti risultati:

  1. 388 volte
  2. 322 volte
  3. 314 volte
  4. 316 volte
  5. 344 volte
  6. 316 volte

si può affermare che esso non è equilibrato?

Effettivamente il risultato 1 è apparso un numero di volte sensibilmente superiore agli altri, la frequenza attesa è di 333,333 per ciascun risultato (il dado segue una distribuzione uniforme, quindi la frequenza attesa è uguale per tutti i risultati ed è pari a 2000\over 6
) .

La nostra statistica è quindi uguale a \chi^2 = {(388-333,333)^2\over333,333}+{(322-333,333)^2\over333,333}+{(314-333,333)^2\over333,333}+{(316-333,33)
^2\over333,333}+{(344-333,333)^2\over333,333}+{(316-333,333)^2\over333,333}= 12,616

e possiede 5 gradi di libertà.

Se fissiamo l'errore tollerato al 5% (p-value = 0,05) e diamo uno sguardo alle tavole della distribuzione chi quadrato con 5 gradi di libertà dobbiamo rifiutare l'ipotesi nulla con valori della statistica test superiori a 11,07.

La nostra statistica test è uguale a 12,616 pertanto dobbiamo respingere l'ipotesi che il dado sia equilibrato.

Il test chi quadrato funziona quando nessun valore si presenta con una frequenza inferiore a 5, se ciò accade è meglio utilizzare altri test sulle frequenze come il Test di Kolmogorov-Smirnov

Tra i test chi quadrato si possono elencare:

  • Test chi quadrato di Pearson
  • il test chi quadrato di Yates, ovvero la correzione di Yates per la continuità
  • il test chi quadrato di Mantel-Haenszel

nonché diversi test che in determinate situazioni (solitamente quando si è in presenza di molti dati) fanno ricorso alla v.c. Chi Quadrato come distribuzione approssimativa

Fonti[modifica | modifica wikitesto]

  1. ^ Paolo Baldi, Calcolo delle probabilità e statistica, Milano, McGraw-Hill, 1998.

[1]

  1. ^ Murray R.Spiegel, STATISTICA - 2a edizione, collana SCHAUM - ETAS LIBRI.