Distribuzione normale multivariata: differenze tra le versioni

Naviga nella cronologia in modo interattivo

← Differenza precedente Differenza successiva →

Contenuto cancellato Contenuto aggiunto

In linea

Versione delle 04:37, 21 nov 2020

Funzione di densità di una normale multivariata

In teoria della probabilità e statistica, la distribuzione normale multivariata o distribuzione gaussiana multivariata o vettore gaussiano è una generalizzazione della distribuzione normale (univariata) a dimensioni più elevate. Una definizione è che un vettore di variabili aleatorie ha una distribuzione normale k-variata se ogni combinazione lineare delle sue k componenti ha distribuzione normale univariata. La sua importanza deriva principalmente dal teorema del limite centrale multivariato. La distribuzione normale multivariata è spesso utilizzata per descrivere, almeno approssimativamente, un qualunque insieme di variabili aleatorie a valori reali (possibilmente) correlate, ognuna delle quali è clusterizzata attorno ad un valore medio.

Definizioni

Notazione e parametrizzazione

La distribuzione normale multivariata di un vettore aleatorio k-dimensionale $\mathbf {X} =(X_{1},\ldots ,X_{k})^{\mathrm {T} }$ può essere scritta secondo la notazione:

\mathbf {X} \ \sim \ {\mathcal {N}}({\boldsymbol {\mu }},\,{\boldsymbol {\Sigma }}),

o, per rendere esplicito il fatto che $\mathbf {X}$ sia k-dimensionale,

\mathbf {X} \ \sim \ {\mathcal {N}}_{k}({\boldsymbol {\mu }},\,{\boldsymbol {\Sigma }}),

con un vettore della media d dimensione k

{\boldsymbol {\mu }}=\operatorname {E} [\mathbf {X} ]=(\operatorname {E} [X_{1}],\operatorname {E} [X_{2}],\ldots ,\operatorname {E} [X_{k}])^{\textbf {T}},

e matrice di covarianza di dimensione $k\times k$

\Sigma _{i,j}:=\operatorname {E} [(X_{i}-\mu _{i})(X_{j}-\mu _{j})]=\operatorname {Cov} [X_{i},X_{j}]

per cui $1\leq i,j\leq k.$ La matrice inversa della matrice di covarianza è chiamata matrice di precisione, e si indica come ${\boldsymbol {Q}}={\boldsymbol {\Sigma }}^{-1}$ .

Vettore aleatorio normale standard

Un vettore aleatorio a valori reali $\mathbf {X} =(X_{1},\ldots ,X_{k})^{\mathrm {T} }$ è detto vettore aleatorio normale standard se tutte le sue componenti $X_{n}$ sono indipendenti e ognuna è una variabile aleatoria normale di valore medio nullo e varianza unitaria, cioè se $X_{n}\sim \ {\mathcal {N}}(0,1)$ per tutti i valori di $n$ .^[1]p. 454

Vettore aleatorio normale centrato

Un vettore aleatorio a valori reali $\mathbf {X} =(X_{1},\ldots ,X_{k})^{\mathrm {T} }$ è chiamato vettore aleatorio normale centrato se esiste una matrice deterministica ${\boldsymbol {A}}$ di dimensione $k\times \ell$ tale per cui ${\boldsymbol {A}}\mathbf {Z}$ ha la stessa distribuzione di $\mathbf {X}$ dove $\mathbf {Z}$ è un vettore aleatorio normale standard con $\ell$ componenti.^[1]p. 454

Vettore aleatorio normale

Un vettore aleatorio a valori reali $\mathbf {X} =(X_{1},\ldots ,X_{k})^{\mathrm {T} }$ è detto vettore aleatorio normale se esistono un vettore aleatorio $\ell$ -dimensionale $\mathbf {Z}$ , che è un vettore aleatorio normale standard, un vettore $k$ -dimensionale $\mathbf {\mu }$ , e una matrice ${\boldsymbol {A}}$ di dimensione $k\times \ell$ , tale per cui $\mathbf {X} ={\boldsymbol {A}}\mathbf {Z} +\mathbf {\mu }$ .^[2]p. 454^[1]p. 455

Formalmente:Template:Equation box 1Da qui la matrice delle covarianze è ${\boldsymbol {\Sigma }}={\boldsymbol {A}}{\boldsymbol {A}}^{\mathrm {T} }$ .

Nel caso degenere in cui la matrice delle covarianze fosse singolare, la distribuzione corrispondente non ha densità; vedi la sezione seguente per dettagli. Questa situazione capita frequentemente in statistica; per esempio, nella distribuzione dei vettori dei residui nel metodo di regressione dei minimi quadrati ordinario. Le $X_{i}$ in genere non sono indipendenti; possono essere visti come il risultato dell'applicazionedella matrice ${\boldsymbol {A}}$ all'insieme delle variabili gaussiane indipendenti $\mathbf {Z}$ .

Definizioni equivalenti

Le seguenti definizioni sono equivalenti alla definizione data in precedenza. Un vettore aleatorio $\mathbf {X} =(X_{1},\ldots ,X_{k})^{T}$ ha una distribuzione normale multivariata se soddisfa una delle seguenti condizioni equivalenti.

Ogni combinazione lineare $Y=a_{1}X_{1}+\cdots +a_{k}X_{k}$ delle proprie componenti è normalmente distribuita. Cioè, per un qualunque vettore costante $\mathbf {a} \in \mathbb {R} ^{k}$ , il valore aleatorio $Y=\mathbf {a} ^{\mathrm {T} }\mathbf {X}$ ha una distribuzione normale univariata, dove una distribuzione normale univariata con varianza nulla è un punto materiale sulla sua media.
Esistono un vettore k-dimensionale $\mathbf {\mu }$ e una matrice di dimensione $k\times k$ simmetrica e positiva semidefinita ${\boldsymbol {\Sigma }}$ , tali per cui la funzione caratteristica di $\mathbf {X}$ è

\varphi _{\mathbf {X} }(\mathbf {u} )=\exp {\Big (}i\mathbf {u} ^{T}{\boldsymbol {\mu }}-{\tfrac {1}{2}}\mathbf {u} ^{T}{\boldsymbol {\Sigma }}\mathbf {u} {\Big )}.

La distribuzione normale sferica può essere caratterizzata come l'unica distribuzione in cui le componenti siano indipendenti in un qualunque sistema di coordinate cartesiano.^[3]^[4]

Voci correlate

Portale Matematica

Portale Statistica

^ ^a ^b ^c Amos Lapidoth, A Foundation in Digital Communication, Cambridge University Press, 2009, ISBN 978-0-521-19395-5.
^ Allan Gut, An Intermediate Course in Probability, Springer, 2009, ISBN 978-1-441-90161-3.
^ On a characterization of the normal distribution, in American Journal of Mathematics, vol. 61, n. 3, 1939, pp. 726–728, DOI:10.2307/2371328.
^ Characterization of the p-generalized normal distribution, in Journal of Multivariate Analysis, vol. 100, n. 5, 2009, pp. 817–820, DOI:10.1016/j.jmva.2008.07.006.

[Lapidoth-1] Amos Lapidoth, A Foundation in Digital Communication, Cambridge University Press, 2009, ISBN 978-0-521-19395-5.

[Gut-2] Allan Gut, An Intermediate Course in Probability, Springer, 2009, ISBN 978-1-441-90161-3.

[3] On a characterization of the normal distribution, in American Journal of Mathematics, vol. 61, n. 3, 1939, pp. 726–728, DOI:10.2307/2371328.

[4] Characterization of the p-generalized normal distribution, in Journal of Multivariate Analysis, vol. 100, n. 5, 2009, pp. 817–820, DOI:10.1016/j.jmva.2008.07.006.

[1]

[2]

[3]

[4]

@@ Riga 1: / Riga 1: @@
 {{F|matematica|arg2=statistica|febbraio 2014}}
 [[File:BivariateNormalDifferentVolas.png|thumb|Funzione di densità di una normale multivariata]]
-In [[teoria della probabilità]] e [[statistica]], la '''distribuzione normale multivariata''' o '''distribuzione gaussiana multivariata''' o '''vettore gaussiano''' è una generalizzazione della [[distribuzione normale]] a dimensioni più elevate. Un [[Variabile casuale multivariata|vettore di variabili aleatorie]] ha una distribuzione normale multivariata se ogni [[combinazione lineare]] delle sue componenti ha distribuzione normale.
+In [[teoria della probabilità]] e [[statistica]], la '''distribuzione normale multivariata''' o '''distribuzione gaussiana multivariata''' o '''vettore gaussiano''' è una generalizzazione della [[distribuzione normale]] (univariata) a dimensioni più elevate. Una definizione è che un [[Variabile casuale multivariata|vettore di variabili aleatorie]] ha una distribuzione normale k-variata se ogni [[combinazione lineare]] delle sue k componenti ha distribuzione normale univariata. La sua importanza deriva principalmente dal [[teorema del limite centrale multivariato]]. La distribuzione normale multivariata è spesso utilizzata per descrivere, almeno approssimativamente, un qualunque insieme di [[Variabile casuale|variabili aleatorie]] a valori reali (possibilmente) [[Correlazione (statistica)|correlate]], ognuna delle quali è clusterizzata attorno ad un valore medio.
+== Definizioni ==
+=== Notazione e parametrizzazione ===
+La distribuzione normale multivariata di un vettore aleatorio k-dimensionale <math>\mathbf{X} = (X_1,\ldots,X_k)^{\mathrm T}</math> può essere scritta secondo la notazione:
-== Notazione ==
-La distribuzione normale multivariata di un vettore di variabili aleatorie ''k''-dimensionale {{Tutto attaccato|''X'' {{=}} [''X''<sub>1</sub>, ''X''<sub>2</sub>, …, ''X<sub>k</sub>'']}} viene indicata con la seguente notazione:
 : <math>
-    X\ \sim\ \mathcal{N}(\mu,\, \Sigma),
+    \mathbf{X}\ \sim\ \mathcal{N}(\boldsymbol\mu,\, \boldsymbol\Sigma),
   </math>
-oppure, per esplicitare la dimensione del vettore:
+o, per rendere esplicito il fatto che <math>\mathbf{X}</math> sia k-dimensionale,
 : <math>
-    X\ \sim\ \mathcal{N}_k(\mu,\, \Sigma).
+    \mathbf{X}\ \sim\ \mathcal{N}_k(\boldsymbol\mu,\, \boldsymbol\Sigma),
+  </math>
+con un vettore della [[Media (statistica)|media]] d dimensione k
+: <math> \boldsymbol\mu = \operatorname{E}[\mathbf{X}] = ( \operatorname{E}[X_1], \operatorname{E}[X_2], \ldots, \operatorname{E}[X_k] ) ^ \textbf{T}, </math>
+e [[Covarianza (probabilità)|matrice di covarianza]] di dimensione <math>k \times k</math>
+: <math> \Sigma_{i,j} := \operatorname{E} [(X_i - \mu_i)( X_j - \mu_j)] = \operatorname{Cov}[X_i, X_j] </math>
+per cui <math>1 \le i,j \le k.</math> La matrice [[inversa]] della matrice di covarianza è chiamata matrice di [[Precisione (statistica)|precisione]], e si indica come <math>\boldsymbol{Q}=\boldsymbol\Sigma^{-1}</math>.
+=== Vettore aleatorio normale standard ===
+Un vettore aleatorio a valori reali  <math>\mathbf{X} = (X_1,\ldots,X_k)^{\mathrm T}</math> è detto '''vettore aleatorio normale standard''' se tutte le sue componenti <math>X_n</math> sono indipendenti e ognuna è una variabile aleatoria normale di valore medio nullo e varianza unitaria, cioè se <math>X_n \sim\ \mathcal{N}(0,1)</math> per tutti i valori di <math>n</math>.<ref name="Lapidoth">{{cite book|first=Amos|last=Lapidoth|year=2009|title=A Foundation in Digital Communication|publisher=Cambridge University Press|isbn=978-0-521-19395-5}}</ref>{{rp|p. 454}}
+=== Vettore aleatorio normale centrato ===
+Un vettore aleatorio a valori reali <math>\mathbf{X} = (X_1,\ldots,X_k)^{\mathrm T}</math> è chiamato '''vettore aleatorio normale centrato''' se esiste una matrice deterministica <math>\boldsymbol{A}</math> di dimensione <math>k \times \ell</math> tale per cui <math>\boldsymbol{A} \mathbf{Z}</math> ha la stessa distribuzione di <math>\mathbf{X}</math> dove <math>\mathbf{Z}</math> è un vettore aleatorio normale standard con <math>\ell</math> componenti.<ref name="Lapidoth" />{{rp|p. 454}}
+=== Vettore aleatorio normale ===
+Un vettore aleatorio a valori reali <math>\mathbf{X} = (X_1,\ldots,X_k)^{\mathrm T}</math> è detto '''vettore aleatorio normale''' se esistono un vettore aleatorio <math>\ell</math>-dimensionale <math>\mathbf{Z}</math>, che è un vettore aleatorio normale standard, un vettore <math>k</math>-dimensionale <math>\mathbf{\mu}</math>, e una matrice <math>\boldsymbol{A}</math> di dimensione <math>k \times \ell</math>, tale per cui <math>\mathbf{X}=\boldsymbol{A} \mathbf{Z} + \mathbf{\mu}</math>.<ref name="Gut">{{cite book|first=Allan|last=Gut|year=2009|title=An Intermediate Course in Probability|publisher=Springer|isbn=978-1-441-90161-3}}</ref>{{rp|p. 454}}<ref name="Lapidoth" />{{rp|p. 455}}
+Formalmente:{{Equation box 1|border|indent=|title=|equation=<math>
+\mathbf{X}\ \sim\ \mathcal{N}(\mathbf{\mu}, \boldsymbol\Sigma) \quad \iff \quad \text{there exist } \mathbf{\mu}\in\mathbb{R}^k,\boldsymbol{A}\in\mathbb{R}^{k\times \ell} \text{ such that } \mathbf{X}=\boldsymbol{A} \mathbf{Z} + \mathbf{\mu} \text{ for } Z_n \sim\ \mathcal{N}(0, 1), \text{i.i.d.}
+</math>|cellpadding=6|border colour=#0073CF|background colour=#F5FFFA}}Da qui la [[matrice delle covarianze]] è <math>\boldsymbol\Sigma = \boldsymbol{A} \boldsymbol{A}^{\mathrm T}</math>.
+Nel caso [[Degenerazione (matematica)|degenere]] in cui la matrice delle covarianze fosse [[Matrice singolare|singolare]], la distribuzione corrispondente non ha densità; vedi la [[Distribuzione normale multivariata|sezione seguente]] per dettagli. Questa situazione capita frequentemente in [[statistica]]; per esempio, nella distribuzione dei vettori dei [[Residuo (analisi complessa)|residui]] nel metodo di regressione dei [[Metodo dei minimi quadrati|minimi quadrati]] ordinario. Le <math>X_i</math> in genere ''non'' sono indipendenti; possono essere visti come il risultato dell'applicazionedella matrice <math>\boldsymbol{A}</math> all'insieme delle variabili gaussiane indipendenti <math>\mathbf{Z}</math>.
+=== Definizioni equivalenti ===
+Le seguenti definizioni sono equivalenti alla definizione data in precedenza. Un vettore aleatorio <math>\mathbf{X} = (X_1,\ldots,X_k)^T</math> ha una distribuzione normale multivariata se soddisfa una delle seguenti condizioni equivalenti.
+* Ogni combinazione lineare <math>Y=a_1 X_1 + \cdots + a_k X_k</math> delle proprie componenti è [[Distribuzione normale|normalmente distribuita]]. Cioè, per un qualunque vettore costante <math>\mathbf{a} \in \mathbb{R}^k</math>, il valore aleatorio <math>Y=\mathbf{a}^{\mathrm T}\mathbf{X}</math> ha una distribuzione normale univariata, dove una distribuzione normale univariata con varianza nulla è un punto materiale sulla sua media.
+* Esistono un vettore ''k''-dimensionale <math>\mathbf{\mu}</math> e una matrice di dimensione <math>k \times k</math> simmetrica e [[Matrice definita positiva|positiva semidefinita]] <math>\boldsymbol\Sigma</math>, tali per cui la [[Funzione caratteristica (teoria della probabilità)|funzione caratteristica]] di <math>\mathbf{X}</math> è
+:: <math>
+    \varphi_\mathbf{X}(\mathbf{u}) = \exp\Big( i\mathbf{u}^T\boldsymbol\mu - \tfrac{1}{2} \mathbf{u}^T\boldsymbol\Sigma \mathbf{u} \Big).
   </math>
-Il vettore della [[media (statistica)|media]] è
-:<math> \mu = [ \operatorname{E}[X_1], \operatorname{E}[X_2], \ldots, \operatorname{E}[X_k]] </math>
-e la [[Covarianza (probabilità)|matrice di covarianza]] ''k x k''
-:<math> \Sigma = [\operatorname{Cov}[X_i, X_j]]_{i=1,2,\ldots,k; j=1,2,\ldots,k} </math>
+La distribuzione normale sferica può essere caratterizzata come l'unica distribuzione in cui le componenti siano indipendenti in un qualunque sistema di coordinate cartesiano.<ref>{{cite journal|last1=Kac|first1=M.|title=On a characterization of the normal distribution|journal=American Journal of Mathematics|date=1939|volume=61|issue=3|pages=726–728|jstor=2371328|doi=10.2307/2371328}}</ref><ref>{{cite journal|last1=Sinz|first1=Fabian|last2=Gerwinn|first2=Sebastian|last3=Bethge|first3=Matthias|title=Characterization of the p-generalized normal distribution|journal=Journal of Multivariate Analysis|date=2009|volume=100|issue=5|pages=817–820|url=|doi=10.1016/j.jmva.2008.07.006}}</ref>
-== Definizione ==
-Si dice che un vettore di variabili aleatorie <math> X=(X_1,X_2,...X_n) </math> ha densità multivariata normale se soddisfa una delle seguenti condizioni equivalenti:
-* Ogni combinazione lineare <math> Y=a_1 X_1 + ... + a_n X_n </math> ha [[distribuzione normale]].
-* Esistono un vettore Z  di variabili aleatorie di dimensione ''ℓ'' le cui componenti sono indipendenti e hanno distribuzione normale standard, un vettore  μ di dimensione ''k'' e una matrice A ''k×ℓ'' tali che <math> X=AZ + \mu </math>
-* Esiste un vettore ''μ'' di dimensione k e una [[matrice definita positiva|matrice semidefinita positiva]] <math> \Sigma </math> tali che la [[funzione caratteristica (teoria della probabilità)|funzione caratteristica]] di X sia
-::<math>\varphi_X(u) = \exp\Big( iu'\mu - \tfrac{1}{2} u'\Sigma u \Big)</math>
 == Voci correlate ==

Distribuzione normale multivariata: differenze tra le versioni

Versione delle 04:37, 21 nov 2020

Indice