Distribuzione di Kolmogorov-Smirnov

Da Wikipedia, l'enciclopedia libera.
Vai alla navigazione Vai alla ricerca

In teoria delle probabilità la distribuzione di Kolmogorov-Smirnov è una distribuzione di probabilità discreta utilizzata nell'ambito dei test non parametrici e in particolare nei test di Kolmogorov-Smirnov e di Kuiper che richiedono come ipotesi delle variabili casuali continue per lo meno ordinali.

In realtà si tratta di due distinte distribuzioni di probabilità costruite con un procedimento analogo, che si distingue a seconda se fa riferimento al test di K-S a due code o a una coda.

Costruzione dei valori della distribuzione[modifica | modifica wikitesto]

La distribuzione di Kolmogorov-Smirnov ha due parametri e e la funzione di probabilità viene costruita nel seguente modo, che fa esplicito riferimento al test di Kolmogorov-Smirnov:

Siano per e sia se l'unità fa parte del gruppo A che ha valori e zero nel caso faccia parte del gruppo B che ha valori. Quindi ad esempio, ipotizzando che e e che il terzo e quarto valore facciano parte del gruppo B l'appartenenza ai gruppi è definita da:

i      1   2   3   4   5   6   7
Gruppo A   A   B   B   A   A   A

Si calcoli per tutte le combinazioni (nell'esempio ) il valore della variabile test di Kolmogorov-Smirnov, che nella combinazioni presa come esempio è uguale a 0,6 (trovato alla quarta colonna):

i        1     2    3    4    5    6    7
Gruppo   A     A    B    B    A    A    A
  A      1     2    -    -    5    6    7
  B      -     -    3    4    -    -    -
f(A)    0,2   0,2   -    -   0,2  0,2  0,2
f(B)     -     -   0,5  0,5   -    -    -
F(A)    0,2   0,4  0,4  0,4  0,6  0,8   1
F(B)     0     0   0,5   1    1    1    1    
|Diff|  0,2   0,4  0,1  0,6  0,4  0,2   0

Per le 21 combinazioni si ottengono i valori di seguito indicati (la 16-esima riga corrisponde alla combinazione usata come esempio):

  k      Combinazione        D
  1   A  A  A  A  A  B  B   D=1
  2   A  A  A  A  B  A  B   D=0,8
  3   A  A  A  B  A  A  B   D=0,6
  4   A  A  B  A  A  A  B   D=0,5
  5   A  B  A  A  A  A  B   D=0,5
  6   B  A  A  A  A  A  B   D=0,5
  7   A  A  A  A  B  B  A   D=0,8
  8   A  A  A  B  A  B  A   D=0,6
  9   A  A  B  A  A  B  A   D=0,4
 10   A  B  A  A  A  B  A   D=0,3
 11   B  A  A  A  A  B  A   D=0,5
 12   A  A  A  B  B  A  A   D=0,6
 13   A  A  B  A  B  A  A   D=0,4
 14   A  B  A  A  B  A  A   D=0,4
 15   B  A  A  A  B  A  A   D=0,5
 16   A  A  B  B  A  A  A   D=0,6
 17   A  B  A  B  A  A  A   D=0,6
 18   B  A  A  B  A  A  A   D=0,6
 19   A  B  B  A  A  A  A   D=0,8
 20   B  A  B  A  A  A  A   D=0,8
 21   B  B  A  A  A  A  A   D=1

I valori sono distribuiti secondo quella che è appunto la distribuzione di Kolmogorov-Smirnov con e

 D       p            Σp
0,3  1/21=0,0477   1/21=0,0477   
0,4  3/21=0,1429   4/21=0,1905
0,5  5/21=0,2381   9/21=0,4286
0,6  6/21=0,2857  15/21=0,7143
0,8  4/21=0,1905  19/21=0,9047
1,0  2/21=0,0952  21/21=1,0000

Allo stesso modo si procede per qualsiasi altra coppia di e

Il caso di m e n grandi[modifica | modifica wikitesto]

Se e assumono valori grandi (indicativamente e ), allora la variabile può essere approssimata ad una distribuzione chi quadrato con 2 gradi di libertà.

Tavole dei valori critici[modifica | modifica wikitesto]

Per il test di Kolmogorov-Smirnov a due code[modifica | modifica wikitesto]

Valori critici per α=1%[modifica | modifica wikitesto]

Valori critici (c) per la regione di rifiuto del test di Kolmogorov-Smirnov a due code: Probabilità(m n Dm,n > c) ≤ 0,01

m \ n |   2    3    4    5    6    7    8    9    10
------+---------------------------------------------
  2   |                                             
  3   |                                     27    30
  4   |                      24   28   32   36    36
  5   |                 25   30   35   35   40    45
  6   |            24   30   36   36   40   45    48
  7   |            28   35   36   42   48   49    53
  8   |            32   35   40   48   56   55    60
  9   |       27   36   40   45   49   55   63    63
 10   |       30   36   45   48   53   60   63    80

Valori critici per α=5%[modifica | modifica wikitesto]

Valori critici (c) per la regione di rifiuto del test di Kolmogorov-Smirnov a due code: Probabilità(m n Dm,n > c) ≤ 0,05

m \ n |   2    3    4    5    6    7    8    9    10
------+---------------------------------------------
  2   |                                16   18    20
  3   |                 15   18   21   21   24    27
  4   |            16   20   20   24   28   28    30
  5   |       15   20   25   24   28   30   35    40
  6   |       18   20   24   30   30   34   39    40
  7   |       21   24   28   30   42   40   42    46
  8   |  16   21   28   30   34   40   48   46    48
  9   |  18   24   28   35   39   42   46   54    53
 10   |  20   27   30   40   40   46   48   53    70

Valori critici per α=10%[modifica | modifica wikitesto]

Valori critici (c) per la regione di rifiuto del test di Kolmogorov-Smirnov a due code: Probabilità(m n Dm,n > c) ≤ 0,10

m \ n |   2    3    4    5    6    7    8    9    10
------+---------------------------------------------
  2   |                 10   12   14   16   18    18
  3   |            12   15   15   18   21   21    24
  4   |       12   16   16   18   21   24   27    28
  5   |  10   15   16   20   24   25   27   30    35
  6   |  12   15   18   24   30   28   30   33    36
  7   |  14   18   21   25   28   35   34   36    40
  8   |  16   21   24   27   30   34   40   40    44
  9   |  18   21   27   30   33   36   40   54    50
 10   |  18   24   28   35   36   40   44   50    60

Voci correlate[modifica | modifica wikitesto]

  Portale Matematica: accedi alle voci di Wikipedia che trattano di matematica