Varianza

Da Wikipedia, l'enciclopedia libera.
Nota disambigua.svg Disambiguazione – Se stai cercando il grado di libertà in termodinamica, vedi Grado di libertà (chimica).

In statistica e in teoria della probabilità la varianza di una variabile statistica o di una variabile aleatoria è una funzione, indicata con o con (o semplicemente con se la variabile è sottointesa), che fornisce una misura della variabilità dei valori assunti dalla variabile, nello specifico, di quanto essi si discostino quadraticamente rispettivamente dalla media aritmetica o dal valore atteso .

Probabilità[modifica | modifica wikitesto]

Definizione[modifica | modifica wikitesto]

La varianza della variabile aleatoria è definita come il valore atteso del quadrato della variabile aleatoria centrata

Un esempio di "misura" dello scostamento di una variabile aleatoria dalla media è dato dalla disuguaglianza di Čebyšëv che controlla questo scostamento in termini dello scarto tipo:

dove

Proprietà[modifica | modifica wikitesto]

  • La varianza di una variabile aleatoria non è mai negativa, ed è zero solamente quando la variabile assume quasi certamente un solo valore , cioè se .
  • Una formula alternativa per la varianza è

Questa formula è più pratica per calcolare la varianza.

Dimostrazione[modifica | modifica wikitesto]

La varianza di è per definizione pari al valore atteso di

:

per la linearità del valore atteso si ottiene

.
  • La varianza è invariante per traslazione, che lascia fisse le distanze dalla media, e cambia quadraticamente per riscalamento:

Dimostrazione[modifica | modifica wikitesto]

Sfruttando la linearità del valore atteso si trova

quindi

  • La varianza della somma di due variabili indipendenti o anche solo incorrelate è pari alla somma delle loro varianze

Dimostrazione[modifica | modifica wikitesto]

Se , allora e

e siccome le variabili sono indipendenti risulta

Nel caso generale basta traslare le variabili di modo che abbiano valore atteso nullo (come ); la loro varianza non cambia.

  • Usando le due precedenti affermazioni, possiamo dire che la varianza della differenza di due variabili indipendenti è pari alla somma delle loro varianze
  • Se e non sono indipendenti, la formula viene corretta dalla loro covarianza,

dove

  • In particolare, la media aritmetica di variabili aleatorie indipendenti aventi la medesima distribuzione, ha varianza aritmetica

Variabili aleatorie discrete e continue[modifica | modifica wikitesto]

La varianza di una variabile aleatoria discreta a valori in un insieme si calcola attraverso la sua funzione di probabilità:

La varianza di una variabile aleatoria continua a valori in un insieme si calcola attraverso la sua densità di probabilità:

Esempio[modifica | modifica wikitesto]

Una variabile aleatoria di Bernoulli , cioè che ha probabilità di fornire "1" e probabilità di fornire "0", ha valore atteso

e la sua varianza può essere calcolata come

oppure come

Statistica[modifica | modifica wikitesto]

In statistica la varianza è un indice di variabilità. Data una distribuzione di un carattere quantitativo su una popolazione di elementi, la varianza è la media aritmetica del quadrato delle distanze dei valori dalla loro media

dove è la media aritmetica di .

In statistica viene molto spesso utilizzata anche la radice quadrata della varianza, vale a dire lo scarto quadratico medio (o deviazione standard o scarto tipo) . Con riferimento a questa notazione la varianza si trova quindi anche indicata come .

Stimatori[modifica | modifica wikitesto]

In statistica si utilizzano solitamente due stimatori per la varianza su un campione di cardinalità :

e

dove è la media campionaria. Il primo è detto varianza campionaria, mentre il secondo è detto varianza campionaria corretta a causa della sua proprietà di correttezza. Infatti lo stimatore è privo di distorsione, cioè il suo valore atteso è proprio la varianza .

Dimostrazione[modifica | modifica wikitesto]

Al contrario, lo stimatore ha un valore atteso diverso dalla varianza, .

Una spiegazione del termine è data dalla necessità di stimare anche la media che per il teorema del limite centrale ha varianza 1/n. Se la media è nota, lo stimatore diventa corretto. Questa è detta "correzione di Bessel".

Se le sono variabili aleatorie normali , lo stimatore è una variabile aleatoria con distribuzione .

Esempio[modifica | modifica wikitesto]

Il campione di elementi ha media campionaria pari a:

e gli stimatori della varianza valgono rispettivamente

e

Voci correlate[modifica | modifica wikitesto]

Altri progetti[modifica | modifica wikitesto]

Collegamenti esterni[modifica | modifica wikitesto]

Controllo di autorità GND: (DE4078739-4