Utente:Pino723/Sandbox/s5

Da Wikipedia, l'enciclopedia libera.
Vai alla navigazione Vai alla ricerca

Test di adattamento di Kolmogorov-Smirnov per dati continui[modifica | modifica wikitesto]

Confronto tra funzione di ripartizione empirica (in blu) e funzione di ripartizione teorica (in rosso)

Considerando un campione di dati proveniente da una distribuzione continua si vuole verificare l'ipotesi nulla che la relativa funzione di ripartizione sia una certa assegnata; a tal scopo si definisce la funzione di ripartizione empirica:[1]

dove # indica la cardinalità o il numero di elementi dell'insieme.

In base a tale definizione, è uguale alla frazione dei dati del campione minori o uguali a , e quindi rappresenta la funzione di ripartizione della variabile aleatoria discreta che può assumere gli valori osservati con uguale probabilità, e risulta essere una funzione a gradini.[2]

Poiché è uno stimatore della probabilità che un'osservazione sia minore o uguale a , cioè della funzione di ripartizione reale dei dati, se l'ipotesi nulla fosse vera, allora e non devono scostarsi più di quanto sia ragionevole aspettarsi.[2]

Per valutare l'entità di tale scostamento si definisce la statistica del test di Kolmogorov-Smirnov:[2]

Chiamato il valore assunto dalla statistica , si definisce il p-dei-dati come:[3]

essendo la probabilità che sia maggiore o uguale a nell'ipotesi che sia la vera distribuzione della popolazione.

Poiché è dimostrabile che la distribuzione di , e quindi anche , non dipende dalla scelta di , si può stimare simulando una qualunque distribuzione continua su , anche quella uniforme su (0, 1).[3]

Per effettuare un test con significatività che in prima approssimazione non dipenda da si può definire la quantità :

per cui i valori critici sono quelli che soddisfano la relazione:

Perciò, in un test con significatività si rifiuta l'ipotesi nulla che sia la distribuzione reale della popolazione se il valore ottenuto dai dati risulta maggiore di .[4]

Approssimazioni di per valori notevoli di
Livello di significatività 0,10 0,05 0,025 0,01
Valore critico 1,224 1,358 1,480 1,626
  1. ^ Ross (2015), pp. 503-504
  2. ^ a b c Ross (2015), p. 504
  3. ^ a b Ross (2015), p. 506
  4. ^ Ross (2015), p. 507