Covarianza (probabilità): differenze tra le versioni

Da Wikipedia, l'enciclopedia libera.
Vai alla navigazione Vai alla ricerca
Contenuto cancellato Contenuto aggiunto
Riga 43: Riga 43:
In [[statistica]] la covarianza di due [[variabile (statistica)|variabili statistiche]] <math> X</math> e <math>Y</math>, indicata come <math>\textstyle \sigma_{X,Y}=\text{Cov}(X,Y)\ </math>, è un [[Indice (statistica)|indice]] di variabilità congiunta.
In [[statistica]] la covarianza di due [[variabile (statistica)|variabili statistiche]] <math> X</math> e <math>Y</math>, indicata come <math>\textstyle \sigma_{X,Y}=\text{Cov}(X,Y)\ </math>, è un [[Indice (statistica)|indice]] di variabilità congiunta.


Su una [[Popolazione (statistica)|popolazione]] di <math>n</math> osservazioni congiunte <math>(x_i,y_i)</math>, di rispettive [[Media (statistica)|medie]] <math>\bar{x}</math> e <math>\bar{y}</math>, la covarianza osservata è
Su una [[Popolazione (statistica)|popolazione]] di <math>N</math> osservazioni congiunte <math>(x_i,y_i)</math>, di rispettive [[Media (statistica)|medie]] <math>\bar{x}</math> e <math>\bar{y}</math>, la covarianza osservata è
:<math> \sigma_{X,Y}=\frac{1}{N}\sum_{i=1}^N(x_i-\bar{x})(y_i-\bar{y})=\frac{1}{N}\sum_{i=1}^N x_iy_i-\left(\frac{1}{N}\sum_{i=1}^N x_i\right)\left(\frac{1}{N}\sum_{i=1}^N y_i\right)</math>.
:<math> \sigma_{X,Y}=\frac{1}{N}\sum_{i=1}^N(x_i-\bar{x})(y_i-\bar{y})=\frac{1}{N}\sum_{i=1}^N x_iy_i-\left(\frac{1}{N}\sum_{i=1}^N x_i\right)\left(\frac{1}{N}\sum_{i=1}^N y_i\right)</math>.


Uno [[stimatore]] della covarianza su un [[Campione (statistica)|campione]] di <math>N</math> osservazioni congiunte <math>(x_i,y_i)</math> è
Uno [[stimatore]] della covarianza su un [[Campione (statistica)|campione]] di <math>n</math> osservazioni congiunte <math>(x_i,y_i)</math> è
:<math>S_{X,Y}=\frac{\sum_{i=1}^n x_i y_i}{n-1}-\frac{\sum_{i=1}^n x_i}{n-1}\frac{\sum_{i=1}^n y_i}{n-1}</math>
:<math>S_{X,Y}=\frac{\sum_{i=1}^n x_i y_i}{n-1}-\frac{\sum_{i=1}^n x_i}{n-1}\frac{\sum_{i=1}^n y_i}{n-1}</math>



Versione delle 11:42, 26 nov 2014

In matematica, in particolare in teoria della probabilità, la covarianza di due variabili aleatorie è un numero Cov(X,Y) che fornisce una misura di quanto le due varino assieme, ovvero della loro dipendenza.

Definizione

La covarianza di due variabili aleatorie X e Y è il valore atteso dei prodotti delle loro distanze dalla media:

La covarianza di X e Y può anche essere espressa come la differenza tra il valore atteso del loro prodotto e il prodotto dei loro valori attesi:

Infatti per la linearità del valore atteso risulta

Proprietà

La covarianza rispetta le seguenti proprietà, per variabili aleatorie X, Y e Z, e costanti a e b:

Due variabili aleatorie indipendenti hanno covarianza nulla, poiché dalla loro indipendenza segue

Due variabili aleatorie che hanno covarianza nulla sono non correlate.

Due variabili aleatorie dipendenti possono essere non correlate. Ad esempio, se X è una variabile aleatoria di legge uniforme sull'intervallo [-1,1] e Y=X2, allora

.

Varianza

La covarianza può essere considerata una generalizzazione della varianza

e compare come termine di correzione nella relazione

Più in generale, per variabili aleatorie e vale

come caso particolare di

.

Statistica

In statistica la covarianza di due variabili statistiche e , indicata come , è un indice di variabilità congiunta.

Su una popolazione di osservazioni congiunte , di rispettive medie e , la covarianza osservata è

.

Uno stimatore della covarianza su un campione di osservazioni congiunte è

La varianza e la covarianza intervengono per definire l'indice di correlazione di Pearson

Voci correlate

Collegamenti esterni

Template:Concetti base di chimica analitica