Valore p

Da Wikipedia, l'enciclopedia libera.

In statistica inferenziale il valore p (o p-value, in inglese) di un test di verifica d'ipotesi indica la probabilità di ottenere un risultato pari o più estremo di quello osservato, supposta vera l'ipotesi nulla (cioè l'ipotesi che si vuole verificare nel test). Talvolta viene anche chiamato livello di significatività osservato.

Livello di significatività[modifica | modifica sorgente]

Sullo stesso test di verifica d'ipotesi, il valore p indica il minimo livello di significatività per il quale l'ipotesi nulla viene rifiutata. Ovvero l'ipotesi nulla viene rifiutata se il test fornisce un valore p inferiore al livello di significatività del test, e viene accettata altrimenti.

Una serie di dati viene detta statisticamente significativa se il suo valore p è minore o uguale a 0,05 (ovvero il 5%). Per fare un esempio, si supponga che un ente governativo abbia raccolto una serie di dati su un'ampia popolazione di pazienti per capire se il consumo di sale abbia effetti negativi sulla salute. Il valore p sarà in questo caso la probabilità che la serie di dati ottenuta sia stato il risultato puramente del caso, assumendo che il sale non abbia alcun effetto sulla salute. Se il valore p è minore del 5%, allora diremo che la serie è statisticamente significativa.

Quanto appena esposto rappresenta la formulazione di una definizione arbitraria. Tutte quelle serie di dati statistici il cui p-value è prossimo (ovvero compreso tra 0,05 e 0,09) sono caratterizzati da una practical significance. Il livello di significatività determina infatti la regione di rifiuto per l'ipotesi nulla, mentre la minima regione di rifiuto sul test condotto determina il valore p.

Per condurre un test statistico è importante fissare il livello di significatività (indicato di solito con la lettera greca α, alpha) prima di calcolare il valore p. Se il valore p venisse calcolato per primo, lo sperimentatore saprebbe quali valori per il livello di significatività conducono ad accettare o rifiutare l'ipotesi nulla, e potrebbe scegliere il livello in funzione del risultato desiderato.

Il valore p viene utilizzato per fornire maggiori informazioni su un test rispetto all'accettazione o al rifiuto per un certo livello di significatività.

Dunque riassumendo i concetti introdotti, fissati ipotesi nulla e un livello di significatività α su cui condurre il test, una volta calcolato il relativo p-value è possibile comportarsi come segue:

  • se p-value ≥ α l'ipotesi nulla va accettata;
  • se p-value < α l'ipotesi nulla va rigettata.

Esempio[modifica | modifica sorgente]

Sia, ad esempio, 3% (o 0,03) il valore p di un test. Il test condotto con un rischio di errore (o livello di significatività) del 5% (o 0,05) induce allora a rifiutare l'ipotesi nulla, mentre lo stesso test condotto con un rischio di errore del 2% induce a non rifiutare l'ipotesi nulla. La conclusione "il valore p è 3%" contiene più informazioni delle sole "ipotesi rifiutata con significatività 5%" o "non rifiutata con significatività 2%".