Varianza
In teoria della probabilità e in statistica la varianza di una variabile aleatoria X (e della distribuzione di probabilità che questa segue) è un numero, indicato con Var(X), che fornisce una misura di quanto siano vari i valori assunti dalla variabile, ovvero di quanto si discostino dalla media E[X].
Indice |
[modifica] Definizione
La varianza di X è definita come il valore atteso del quadrato della variabile aleatoria centrata Y=X-E[X]
In statistica viene spesso preferita la radice quadrata della varianza di X, lo scarto tipo (o scarto quadratico medio) indicato con la lettera σ. Per questo motivo talvolta la varianza viene indicata con σ2.
Un esempio di "misura" dello scostamento di una variabile aleatoria dalla media è dato dal teorema di Čebyšëv che controlla questo scostamento in termini dello scarto tipo:
[modifica] Proprietà
La varianza di una variabile aleatoria non è mai negativa, ed è zero solamente quando la variabile assume quasi certamente un solo valore, P(X=x)=1.
Una formula alternativa per la varianza è
Questa formula è a volte più pratica per calcolare la varianza.
La varianza di X è per definizione pari al valore atteso di
:
per la linearità del valore atteso si ottiene
.
[modifica] Linearità
La varianza è invariante per traslazione, che lascia fisse le distanze dalla media, e cambia quadraticamente per riscalamento:
La varianza della somma di due variabili indipendenti è pari alla somma delle loro varianze
Se
, allora
e
,
e siccome le variabili sono indipendenti risulta
.
Nel caso generale basta traslare le variabili di modo che abbiano valore atteso nullo (come
); la loro varianza non cambia.
Se X e Y non sono indipendenti, la formula viene corretta dalla loro covarianza,
,
dove
In particolare, la media
di n variabili aleatorie indipendenti aventi la medesima legge, ha varianza
[modifica] Variabili discrete e continue
La varianza di una variabile aleatoria discreta X a valori in un insieme S si calcola attraverso la sua funzione di probabilità:
La varianza di una variabile aleatoria continua X a valori in un insieme S si calcola attraverso la sua densità di probabilità:
[modifica] Statistica
In statistica viene utilizzata più spesso della varianza la sua radice quadrata, vale a dire lo scarto quadratico medio
anche detto deviazione standard. Con riferimento a questa notazione la varianza si trova quindi anche indicata come σ2.
[modifica] Stimatori
In statistica si utilizzano solitamente due stimatori per la varianza su un campione di cardinalità n:
e
,
(anche chiamati varianza campionaria) dove
è lo stimatore per la media.
Lo stimatore Sn-1 è privo di bias, ovvero il suo valore atteso è proprio la varianza
.
Al contrario, lo stimatore Sn ha un valore atteso diverso dalla varianza,
.
Una giustificazione del termine n-1 è data dalla necessità di stimare anche la media. Se la media μ è nota, lo stimatore Sn diventa corretto. Questa è detta "Correzione di Bessel".
In contrasto con,
Se le Xi seguono la legge normale N(μ,σ), lo stimatore S2n-1 segue una legge del χ2
- UNIQ1623f0936689be3-math-0000004E-QINU
[modifica] Varianza osservata
Come per gli stimatori, esistono due diverse varianze osservate sui dati di un campione
di media osservata
,
e
.
In particolare, sn è la media quadratica delle distanze dei valori dalla loro media.
[modifica] Esempi
Una variabile aleatoria X di legge di Bernoulli B(p), ovvero che ha probabilità p di fornire "1" e probabilità q=1-p di fornire "0", ha valore medio
- E[X] = 0P(X = 0) + 1P(X = 1) = P(X = 1) = p;
la sua varianza può essere calcolata come
oppure come
.
Il campione {-4, -1, 1, 2, 7} ha media
e le varianze osservate sono
e
.
![\text{Var}(X)=E[Y^2]=E\Big[\big(X-E[X]\big)^2\Big]](http://upload.wikimedia.org/wikipedia/it/math/f/2/3/f23c5e8da20b2409a31a23e1d458fede.png)
![P\Big(\big|X-E[X]\big|\geqslant\lambda\sqrt{\text{Var}(X)}\Big)\leqslant\frac{1}{\lambda^2}](http://upload.wikimedia.org/wikipedia/it/math/4/f/0/4f0944fa5a90d834ae6b15a3759831e8.png)
![\text{Var}(X)=E[X^2]-E[X]^2\](http://upload.wikimedia.org/wikipedia/it/math/9/f/7/9f7258634fe63f0f75910ad31b1dc794.png)
:
.
,
.
,
,![\text{Cov}(X,Y)=E[XY]-E[X]E[Y]\](http://upload.wikimedia.org/wikipedia/it/math/c/f/5/cf5c8a4815b5abea00bf401d049052f1.png)

![E[X]=\sum_{s\in S}sP(X=s)](http://upload.wikimedia.org/wikipedia/it/math/8/d/d/8dd87a76956ce70303c744fe74d084d4.png)
![\text{Var}(X)=\sum_{s\in S}(s-E[X])^2P(X=s)](http://upload.wikimedia.org/wikipedia/it/math/6/0/d/60dcee3b3d4be3db5eb8f0052c468a27.png)
![E[X]=\int_S sf(s) ds\](http://upload.wikimedia.org/wikipedia/it/math/0/c/2/0c25345ed831f6d2e5d72a16ed6c0e56.png)
![\text{Var}(X)=\int_S (s-E[X])^2f(s) ds\](http://upload.wikimedia.org/wikipedia/it/math/6/4/3/643769c913be57ed893dd14625046e02.png)
e
,![\begin{align}
\operatorname{E}[S_{n-1}^2] & = \operatorname{E}\left[\frac{1}{n-1} \sum_{i=1}^n X_i^2 ~ - ~ \frac{n}{n-1} \overline{X}^2 \right] \\[8pt]
& = \frac{1}{n-1}\left( \sum \operatorname{E}[X_i^2] ~ - ~ n \operatorname{E}[\overline{X}^2] \right) \\[8pt]
& = \frac{1}{n-1}\left( n \operatorname{E}[X^2] ~ - ~ n \operatorname{E}[\overline{X}^2] \right) \\[8pt]
& = \frac{n}{n-1}\left( \operatorname{Var}(X) + \operatorname{E}[X]^2 ~ - ~ \operatorname{Var}(\overline{X}) - \operatorname{E}[\overline{X}]^2 \right) \\[8pt]
& = \frac{n}{n-1}\left( \operatorname{Var}(X) + \mu^2 ~ - ~ \frac{1}{n}\operatorname{Var}(X) - \mu^2 \right) \\[8pt]
& = \frac{n}{n-1}\left( \frac{n-1}{n} ~ \operatorname{Var}(X) \right) \\[8pt]
& = \operatorname{Var}(X) \\[8pt]
& = \sigma^2.
\end{align}](http://upload.wikimedia.org/wikipedia/it/math/3/c/9/3c94dca6c7b3bba9fb6b4d01b7a277d0.png)
![\operatorname{E}[S_n^2] = \frac{n-1}{n} \sigma^2.](http://upload.wikimedia.org/wikipedia/it/math/8/7/f/87f6dec7a8b999c4e6da115412102eab.png)
e
.![\text{Var}(X)=E[(X-E[X])^2]=E[(X-p)^2]=p^2P(X=0)+q^2P(X=1)=pq(p+q)=pq\](http://upload.wikimedia.org/wikipedia/it/math/5/6/5/56587981199cb5883a773bee11bcaf95.png)
.

.