Distribuzione normale multivariata

Da Wikipedia, l'enciclopedia libera.
Funzione di densità di una normale multivariata

In teoria della probabilità e statistica, la distribuzione normale multivariata o distribuzione gaussiana multivariata o vettore gaussiano è una generalizzazione della distribuzione normale a dimensioni più elevate. Un vettore di variabili aleatorie ha una distribuzione normale multivariata se ogni combinazione lineare delle sue componenti ha distribuzione normale.

Notazione[modifica | modifica wikitesto]

La distribuzione normale multivariata di un vettore di variabili aleatorie k-dimensionale X = [X1, X2, …, Xk] viene indicata con la seguente notazione:


    X\ \sim\ \mathcal{N}(\mu,\, \Sigma),

oppure, per esplicitare la dimensione del vettore:


    X\ \sim\ \mathcal{N}_k(\mu,\, \Sigma).

Il vettore della media è

 \mu = [ \operatorname{E}[X_1], \operatorname{E}[X_2], \ldots, \operatorname{E}[X_k]]

e la matrice di covarianza k x k

 \Sigma = [\operatorname{Cov}[X_i, X_j]]_{i=1,2,\ldots,k; j=1,2,\ldots,k}

Definizione[modifica | modifica wikitesto]

Si dice che un vettore di variabili aleatorie  X=(X_1,X_2,...X_n) ha densità multivariata normale se soddisfa una delle seguenti condizioni equivalenti:

  • Ogni combinazione lineare  Y=a_1 X_1 + ... + a_n X_n ha distribuzione normale.
  • Esistono un vettore Z di variabili aleatorie di dimensione le cui componenti sono indipendenti e hanno distribuzione normale standard, un vettore aleatorio μ di dimensione k e una matrice A k×ℓ tali che  X=AZ + \mu
  • Esiste un vettore μ di dimensione k e una matrice semidefinita positiva  \Sigma tali che la funzione caratteristica di X sia
\varphi_X(u) = \exp\Big( iu'\mu - \tfrac{1}{2} u'\Sigma u \Big)