Covarianza

Da Wikipedia, l'enciclopedia libera.
Vai a: navigazione, cerca
bussola Disambiguazione – Se stai cercando il concetto fisico, vedi covarianza (fisica).

In teoria della probabilità la covarianza di due variabili aleatorie è un numero Cov(X,Y) che fornisce una misura di quanto le due varino assieme, ovvero della loro dipendenza.

Indice

[modifica] Definizione

La covarianza di due variabili aleatorie X e Y è il valore atteso dei prodotti delle loro distanze dalla media:

\text{cov}(X,Y)=E\Big[\big(X-E[X]\big)(Y-E[Y]\big)\Big].

La covarianza di X e Y può anche essere espressa come la differenza tra il valore atteso del loro prodotto e il prodotto dei loro valori attesi:

\text{cov}(X,Y)=E[XY]-E[X]E[Y]\ .

Infatti per la linearità del valore atteso risulta

E\Big[XY-XE[Y]-E[X]Y+E[X]E[Y]\Big]=E[XY]-E[X]E[Y]-E[X]E[Y]+E[X]E[Y]=E[XY]-E[X]E[Y]\ .

[modifica] Proprietà

La covarianza rispetta le seguenti proprietà, per variabili aleatorie X, Y e Z, e costanti a e b:

  • \text{cov}(X,Y)=\text{cov}(Y,X)\
  • \text{cov}(aX+b,Y)=a\text{cov}(X,Y)\
  • \text{cov}(X+Y,Z)=\text{cov}(X,Z)+\text{cov}(Y,Z)\

Due variabili aleatorie indipendenti hanno covarianza nulla, poiché dalla loro indipendenza segue

E[XY]=E[X]E[Y]\

Due variabili aleatorie che hanno covarianza nulla sono non correlate.

Due variabili aleatorie dipendenti possono essere non correlate. Ad esempio, se X è una variabile aleatoria di legge uniforme sull'intervallo [-1,1] e Y=X2, allora

\textstyle \text{cov}(X,Y)=\text{cov}(X,X^2)=E[X^3]-E[X]E[X^2]=0.5\int_{-1}^1x^3dx-0.5\int_{-1}^1xdx\int_{-1}^1x^2dx=0

[modifica] Varianza

La covarianza può essere considerata una generalizzazione della varianza

\text{Var}(X)=\text{cov}(X,X)\

e compare come termine di correzione nella relazione

\text{Var}(X+Y)=\text{Var}(X)+\text{Var}(Y)+2\text{cov}(X,Y)\

Più in generale, per variabili aleatorie X_1,...,X_n e Y_1,...,Y_m vale

\textstyle \text{Var}(\sum_iX_i)=\text{cov}(\sum_iX_i,\sum_jX_j)=\sum_{i,j}\text{cov}(X_i,X_j)=\sum_i\text{Var}(X_i)+2\sum_{i>j}\text{cov}(X_i,X_j)

come caso particolare di

\textstyle \text{cov}\left(\sum_i X_i, \sum_j Y_j\right)=\sum_{i,j}\text{cov}(X_i,Y_j).

[modifica] Statistica

In statistica la covarianza è anche indicata come

\sigma_{X,Y}=\text{cov}(X,Y)\ .

Su un campione di n osservazioni congiunte (xi,yi), di rispettive medie osservate \bar{x} e \bar{y}, la covarianza osservata è

\textstyle \sigma_{X,Y}=\frac{1}{n}\sum_i(x_i-\bar{x})(y_i-\bar{y})=\frac{1}{n}\sum_ix_iy_i-\frac{1}{n^2}(\sum_ix_i)(\sum_iy_i).

Uno stimatore della covarianza per N osservazioni congiunte (Xi,Yi) è

S_{X,Y}=\frac{\sum_iX_iY_i}{N}-\frac{\sum_iX_i}{N}\frac{\sum_iY_i}{N}

La varianza e la covarianza intervengono per definire l'indice di correlazione di Pearson

\rho_{X,Y}=\frac{\text{cov}(X,Y)}{\sqrt{\text{Var}(X)\text{Var}(Y)}}

[modifica] Voci correlate

Strumenti personali
Namespace

Varianti
Azioni
Navigazione
Comunità
Stampa/esporta
Strumenti
Altre lingue