Varianza

Da Wikipedia, l'enciclopedia libera.
Nota disambigua.svg Disambiguazione – Se stai cercando il grado di libertà in termodinamica, vedi Grado di libertà (chimica).

In statistica e in teoria della probabilità la varianza di una variabile statistica o di una variabile aleatoria è una funzione, indicata con o con (o semplicemente con se la variabile è sottointesa), che fornisce una misura della variabilità dei valori assunti dalla variabile, nello specifico, di quanto essi si discostino quadraticamente rispettivamente dalla media aritmetica o dal valore atteso .

Il termine di "varianza" venne introdotto nel 1918 da Ronald Fisher e sostituì nel tempo la denominazione di "deviazione standard quadratica" utilizzata da Karl Pearson.

Probabilità[modifica | modifica wikitesto]

Definizione[modifica | modifica wikitesto]

La varianza della variabile aleatoria è definita come il valore atteso del quadrato della variabile aleatoria centrata

Un esempio di "misura" dello scostamento di una variabile aleatoria dalla media è dato dalla disuguaglianza di Čebyšëv che controlla questo scostamento in termini dello scarto tipo:

dove

Proprietà[modifica | modifica wikitesto]

Segno della varianza[modifica | modifica wikitesto]

La varianza di una variabile aleatoria non è mai negativa, ed è zero solamente quando la variabile assume quasi certamente un solo valore , cioè se .

Massimo e minimo della varianza fissati i valori estremali della distribuzione[modifica | modifica wikitesto]

Dato un insieme di unità statistiche, dove e sono i valori massimo e minimo tra le unità, il massimo valore che può assumere la varianza è uguale a

Se delle osservazioni si conosce soltanto la media , il valore è uguale a

Espressione della varianza come differenza tra il momento di ordine 2 e il quadrato del valore atteso[modifica | modifica wikitesto]

Exquisite-kfind.png Lo stesso argomento in dettaglio: Formula computazionale per la varianza.

Una formula alternativa per la varianza è

Questa formula è più pratica per calcolare la varianza.

Dimostrazione

La varianza di è per definizione pari al valore atteso di

:

per la linearità del valore atteso si ottiene

.

Invarianza per traslazione[modifica | modifica wikitesto]

La varianza è invariante per traslazione, che lascia fisse le distanze dalla media, e cambia quadraticamente per riscalamento:

Dimostrazione

Sfruttando la linearità del valore atteso si trova

quindi

Varianza della somma di due variabili indipendenti[modifica | modifica wikitesto]

La varianza della somma di due variabili indipendenti o anche solo incorrelate è pari alla somma delle loro varianze

Dimostrazione

Se , allora e

e siccome le variabili sono indipendenti risulta

Nel caso generale basta traslare le variabili di modo che abbiano valore atteso nullo (come ); la loro varianza non cambia.

Varianza della differenza di due variabili indipendenti[modifica | modifica wikitesto]

Usando le due precedenti affermazioni, possiamo dire che la varianza della differenza di due variabili indipendenti è pari alla somma delle loro varianze

Varianza della somma di due variabili non indipendenti[modifica | modifica wikitesto]

Se e non sono indipendenti, la formula viene corretta dalla loro covarianza,

dove

Varianza della media aritmetica di variabili indipendenti[modifica | modifica wikitesto]

In particolare, la media aritmetica di variabili aleatorie indipendenti aventi la medesima distribuzione, ha varianza aritmetica

Variabili aleatorie discrete e continue[modifica | modifica wikitesto]

La varianza di una variabile aleatoria discreta a valori in un insieme si calcola attraverso la sua funzione di probabilità:

La varianza di una variabile aleatoria continua a valori in un insieme si calcola attraverso la sua densità di probabilità:

Esempio[modifica | modifica wikitesto]

Una variabile aleatoria di Bernoulli , cioè che ha probabilità di fornire "1" e probabilità di fornire "0", ha valore atteso

e la sua varianza può essere calcolata come

oppure come

Statistica[modifica | modifica wikitesto]

In statistica la varianza è un indice di variabilità. Data una distribuzione di un carattere quantitativo su una popolazione di elementi, la varianza è la media aritmetica del quadrato delle distanze dei valori dalla loro media

dove è la media aritmetica di .

In statistica viene molto spesso utilizzata anche la radice quadrata della varianza, vale a dire lo scarto quadratico medio (o deviazione standard o scarto tipo) . Con riferimento a questa notazione la varianza si trova quindi anche indicata come .

Stimatori[modifica | modifica wikitesto]

In statistica si utilizzano solitamente due stimatori per la varianza su un campione di cardinalità :

e

dove è la media campionaria. Il primo è detto varianza campionaria, mentre il secondo è detto varianza campionaria corretta a causa della sua proprietà di correttezza. Infatti lo stimatore è privo di distorsione, cioè il suo valore atteso è proprio la varianza:

.
Dimostrazione

Al contrario, lo stimatore ha un valore atteso diverso dalla varianza, .

Una spiegazione del termine è data dalla necessità di stimare anche la media che per il teorema del limite centrale ha varianza 1/n. Se la media è nota, lo stimatore diventa corretto. Questa è detta "correzione di Bessel".

Se le sono variabili aleatorie normali , lo stimatore è una variabile aleatoria con distribuzione .

Esempio[modifica | modifica wikitesto]

Il campione di elementi ha media campionaria pari a:

e gli stimatori della varianza valgono rispettivamente

e

Voci correlate[modifica | modifica wikitesto]

Altri progetti[modifica | modifica wikitesto]

Collegamenti esterni[modifica | modifica wikitesto]

Controllo di autorità GND: (DE4078739-4