Matrice delle covarianze

Da Wikipedia, l'enciclopedia libera.

In statistica multivariata, la matrice delle covarianze (o matrice di varianza e covarianza) si indica di solito con \Sigma ed è una generalizzazione della covarianza al caso di dimensione maggiore di due. Essa è una matrice che rappresenta la variazione di ogni variabile rispetto alle altre (inclusa se stessa).

Sia dato una popolazione di n elementi su cui sono rilevati k caratteri quantitativi X_i. Cioè ogni X_i con i=1,\dots,k è un vettore di n elementi, indicati con  x_{hi} con h=1,\dots,n. L'elemento  x_{hi} rappresenta quindi la modalità dell'h-esima unità statistica rispetto al carattere X_i. La matrice delle covarianze ha dimensione k\times k e ogni elemento è definito come

\sigma_{i j}=\frac{1}{n}\sum_{h=1}^{n}(x_{hi}-\mu_{i})(x_{hj}-\mu_{j}),

dove \mu_i indica la media del carattere X_i.

Significato dei valori[modifica | modifica sorgente]

Ogni elemento sulla diagonale \sigma_{i i} è la varianza del carattere X_i. Ogni elemento \sigma_{ij} (con i \neq j) è la covarianza tra i caratteri X_i e X_j. Nel caso in cui questo valore sia positivo, significa che al crescere di una carattere, cresce anche l'altro. Nel caso in cui questo valore sia negativo, accade il contrario. Se i caratteri sono statisticamente indipendenti, questo valore è 0 (l'implicazione inversa non è necessariamente verificata).

Applicazioni[modifica | modifica sorgente]

Oltre al significato statistico che possiamo dedurre dai termini, la matrice delle covarianze è un parametro della funzione gaussiana, nella statistica multivariata.

Può inoltre essere d'ausilio alla riduzione delle features, tramite l'analisi delle componenti principali (PCA).

Bibliografia[modifica | modifica sorgente]

  • Richard O. Duda, Peter E. Hart, David G. Stork, Wiley Interscience - Pattern Classification (2nd ed.)

Voci correlate[modifica | modifica sorgente]

matematica Portale Matematica: accedi alle voci di Wikipedia che trattano di matematica