Test di Kolmogorov-Smirnov
Il test di Kolmogorov-Smirnov è un test non parametrico che verifica la forma delle distribuzioni campionarie. È applicabile a dati per lo meno ordinali. Nella sua formulazione esatta prevede che le variabili siano continue. Non richiede di per sé alcuna ipotesi sulla distribuzione campionaria (salvo nel caso a un campione, in cui viene testata una distribuzione a propria scelta).
Si distingue in
- test a due code, a un campione oppure a due campioni
- test a una coda, a un campione oppure a due campioni
Indice |
[modifica] Storia
Nel 1933 Andrej Nikolaevič Kolmogorov introdusse la statistica |Fn(x) - F0(x)|, e nel 1939 Nikolaj Vasil'evič Smirnov la utilizza per ricavare quello che oggi è noto come test di Kolmogorov-Smirnov.
[modifica] Test alternativi
È per certi versi l'alternativa non parametrica al test t di Student. Quando tale test è applicabile (ipotesi parametrica di distribuzione gaussiana) e si sceglie lo stesso il test K-S, allora l'efficienza -potenza è pari a circa 95% per piccoli campioni e diminuisce leggermente per campioni grandi.
Rispetto ai non parametrici test della mediana e test del chi quadrato (applicato a dati ordinali) è più potente e dunque da preferire.
Si ritiene che per campioni molto piccoli il test K-S sia da preferire al test di Wilcoxon-Mann-Whitney mentre per campioni grandi quest'ultimo è da preferire.
Valida alternativa è pure il test di Girone.
[modifica] Test di Kolmogorov-Smirnov a due code (a un campione)
Sia X una v.c. generatrice continua, con funzione di ripartizione (f.r.) F(x). Un problema che spesso ricorre nella pratica è quello di verificare che la variabile casuale X abbia funzione di ripartizione uguale ad una data F0(x). In simboli, il problema di ipotesi è del tipo:
H0: F(x) = F0(x), per ogni x
contro
H1: F(x) ≠ F0 (x), per qualche x
Questo significa che l'ipotesi non si riferisce soltanto ad un parametro della variabile casuale X (come accade nel test dei segni), ma l'intera sua funzione di ripartizione.
Sia allora (X1, ..., Xn) un campione casuale di ampiezza n della v.c. X. Sulla base di esso si vuole costruire un test per il problema di ipotesi. Poiché tale problema riguarda la funzione di ripartizione della variabile casuale X, è intuitivo basare la statistica test sulla funzione di ripartizione empirica. Dette quindi X(1), ..., X(n) le n variabile casuale campionarie ordinate, la funzione di ripartizione empirica è definita come:

o equivalentemente in forma più compatta:

dove
è la funzione indicatrice.
La
è una "stima campionaria" della "vera" funzione di ripartizione F(x) della variabile casuale X. Anzi, siamo in presenza di uno stimatore consistente, poiché si può dimostrare che, come conseguenza della legge debole dei grandi numeri, qualunque sia x la
tende in probabilità, per n→∞, a F(x).
L'idea del test di Kolmogorov-Smirnov è piuttosto semplice e intuitiva. Poiché
stima la "vera" f. r. F(x), è logico basarsi su una qualche "distanza" tra
e F0(x). Se
e F0(x) sono "vicine" (cioè sono "sufficientemente simili") si accetta l'ipotesi nulla, mentre la si rifiuta se
e F0(x) sono "lontane" (cioè se sono "molto dissimili"). Come "distanza" si usa la seguente:

cioè la massima differenza (in valore assoluto) tra la f.r. empirica
e la funzione di ripartizione teorica (ipotizzata come vera) F0(x). Per valori "grandi" di Dn si rifiuta l'ipotesi nulla, mentre la si accetta per valori "piccoli" di Dn (vedasi variabile casuale test di Kolmogorov-Smirnov).
Dunque, il "senso" della statistica Dn è intuitivamente evidente. Molto complicato invece è il calcolo della sua distribuzione di probabilità (sotto l'ipotesi nulla). Si può comunque dimostrare che sotto l'ipotesi nulla la distribuzione di probabilità della statistica test Dn non dipende dalla particolare forma funzionale di F0(x).
Questi risultati sono validi per le variabili casuali che hanno funzione di ripartizione continua. Se invece X è una variabile casuale discreta e la sua funzione di ripartizione è quindi discontinua, la distribuzione di probabilità della variabile casuale Dn dipende proprio dalla discontinuità della funzione di ripartizione di X.
[modifica] Voci correlate
- variabile casuale test di Kolmogorov-Smirnov
- Test di Kuiper
- statistica non parametrica, test non parametrico
- Andrey Nikolaevich Kolmogorov
- Test di Girone
- Test di Shapiro-Wilk, test statistico per la verifica di normalità di un insieme di valori