Utente:Pino723/Sandbox/s5

Test di adattamento di Kolmogorov-Smirnov per dati continui[modifica | modifica wikitesto]

Considerando un campione di dati $x_{1},x_{2},...,x_{n}$ proveniente da una distribuzione continua si vuole verificare l'ipotesi nulla che la relativa funzione di ripartizione sia una certa $F$ assegnata; a tal scopo si definisce la funzione di ripartizione empirica:^[1]

F_{e}(x):={\frac {\#\{i:x_{i}\leq x\}}{n}}

dove # indica la cardinalità o il numero di elementi dell'insieme.

In base a tale definizione, $F_{e}(x)$ è uguale alla frazione dei dati del campione minori o uguali a $x$ , e quindi rappresenta la funzione di ripartizione della variabile aleatoria discreta che può assumere gli $n$ valori osservati con uguale probabilità, e risulta essere una funzione a gradini.^[2]

Poiché $F_{e}$ è uno stimatore della probabilità che un'osservazione sia minore o uguale a $x$ , cioè della funzione di ripartizione reale dei dati, se l'ipotesi nulla fosse vera, allora $F$ e $F_{e}$ non devono scostarsi più di quanto sia ragionevole aspettarsi.^[2]

Per valutare l'entità di tale scostamento si definisce la statistica del test di Kolmogorov-Smirnov:^[2]

D:={\underset {-\infty <x<\infty }{\max }}|{F_{e}(x)-F(x)}|

Chiamato $d$ il valore assunto dalla statistica $D$ , si definisce il p-dei-dati come:^[3]

p:=P_{F}(D\geq d)

essendo $P_{F}$ la probabilità che $D$ sia maggiore o uguale a $d$ nell'ipotesi che $F$ sia la vera distribuzione della popolazione.

Poiché è dimostrabile che la distribuzione di $D$ , e quindi anche $P_{F}$ , non dipende dalla scelta di $F$ , si può stimare $p$ simulando una qualunque distribuzione continua su $F$ , anche quella uniforme su (0, 1).^[3]

Per effettuare un test con significatività $\alpha$ che in prima approssimazione non dipenda da $n$ si può definire la quantità $D^{*}$ :

D^{*}:=D\cdot {\biggl (}{\sqrt {n}}+0,12+{\frac {0,11}{\sqrt {n}}}{\biggr )}

per cui i valori critici $d_{\alpha }^{*}$ sono quelli che soddisfano la relazione:

P_{F}(D^{*}\geq d_{\alpha }^{*})=\alpha

Perciò, in un test con significatività $\alpha$ si rifiuta l'ipotesi nulla che $F$ sia la distribuzione reale della popolazione se il valore $D^{*}$ ottenuto dai dati risulta maggiore di $d_{\alpha }^{*}$ .^[4]

Approssimazioni di $d_{\alpha }^{*}$ per valori notevoli di $\alpha$
Livello di significatività $\alpha$	0,10	0,05	0,025	0,01
Valore critico $d_{\alpha }^{*}$	1,224	1,358	1,480	1,626

Sheldon M. Ross, Probabilità e statistica : per l'ingegneria e le scienze, a cura di Francesco Morandin, 3. ed, Maggioli, 2015, ISBN 978-88-916-0994-6, OCLC 918982377.

^ Ross (2015), pp. 503-504
^ ^a ^b ^c Ross (2015), p. 504
^ ^a ^b Ross (2015), p. 506
^ Ross (2015), p. 507

[1] Ross (2015), pp. 503-504

[:0-2] Ross (2015), p. 504

[:1-3] Ross (2015), p. 506

[4] Ross (2015), p. 507

[1]

[2]

[3]

[4]

Utente:Pino723/Sandbox/s5

Test di adattamento di Kolmogorov-Smirnov per dati continui[modifica | modifica wikitesto]

Menu di navigazione

Ricerca