Distribuzione normale multivariata: differenze tra le versioni

Da Wikipedia, l'enciclopedia libera.
Vai alla navigazione Vai alla ricerca
Contenuto cancellato Contenuto aggiunto
Pil56-bot (discussione | contributi)
m →‎Notazione: smistamento lavoro sporco e fix vari
Tradotto la parte in inglese della pagina di Wikipedia corrispondente italiana
Riga 1: Riga 1:
{{F|matematica|arg2=statistica|febbraio 2014}}
{{F|matematica|arg2=statistica|febbraio 2014}}
[[File:BivariateNormalDifferentVolas.png|thumb|Funzione di densità di una normale multivariata]]
[[File:BivariateNormalDifferentVolas.png|thumb|Funzione di densità di una normale multivariata]]
In [[teoria della probabilità]] e [[statistica]], la '''distribuzione normale multivariata''' o '''distribuzione gaussiana multivariata''' o '''vettore gaussiano''' è una generalizzazione della [[distribuzione normale]] a dimensioni più elevate. Un [[Variabile casuale multivariata|vettore di variabili aleatorie]] ha una distribuzione normale multivariata se ogni [[combinazione lineare]] delle sue componenti ha distribuzione normale.
In [[teoria della probabilità]] e [[statistica]], la '''distribuzione normale multivariata''' o '''distribuzione gaussiana multivariata''' o '''vettore gaussiano''' è una generalizzazione della [[distribuzione normale]] (univariata) a dimensioni più elevate. Una definizione è che un [[Variabile casuale multivariata|vettore di variabili aleatorie]] ha una distribuzione normale k-variata se ogni [[combinazione lineare]] delle sue k componenti ha distribuzione normale univariata. La sua importanza deriva principalmente dal [[teorema del limite centrale multivariato]]. La distribuzione normale multivariata è spesso utilizzata per descrivere, almeno approssimativamente, un qualunque insieme di [[Variabile casuale|variabili aleatorie]] a valori reali (possibilmente) [[Correlazione (statistica)|correlate]], ognuna delle quali è clusterizzata attorno ad un valore medio.

== Definizioni ==

=== Notazione e parametrizzazione ===
La distribuzione normale multivariata di un vettore aleatorio k-dimensionale <math>\mathbf{X} = (X_1,\ldots,X_k)^{\mathrm T}</math> può essere scritta secondo la notazione:


== Notazione ==
La distribuzione normale multivariata di un vettore di variabili aleatorie ''k''-dimensionale {{Tutto attaccato|''X'' {{=}} [''X''<sub>1</sub>, ''X''<sub>2</sub>, …, ''X<sub>k</sub>'']}} viene indicata con la seguente notazione:
: <math>
: <math>
X\ \sim\ \mathcal{N}(\mu,\, \Sigma),
\mathbf{X}\ \sim\ \mathcal{N}(\boldsymbol\mu,\, \boldsymbol\Sigma),
</math>
</math>

oppure, per esplicitare la dimensione del vettore:
o, per rendere esplicito il fatto che <math>\mathbf{X}</math> sia k-dimensionale,

: <math>
: <math>
X\ \sim\ \mathcal{N}_k(\mu,\, \Sigma).
\mathbf{X}\ \sim\ \mathcal{N}_k(\boldsymbol\mu,\, \boldsymbol\Sigma),
</math>

con un vettore della [[Media (statistica)|media]] d dimensione k

: <math> \boldsymbol\mu = \operatorname{E}[\mathbf{X}] = ( \operatorname{E}[X_1], \operatorname{E}[X_2], \ldots, \operatorname{E}[X_k] ) ^ \textbf{T}, </math>

e [[Covarianza (probabilità)|matrice di covarianza]] di dimensione <math>k \times k</math>

: <math> \Sigma_{i,j} := \operatorname{E} [(X_i - \mu_i)( X_j - \mu_j)] = \operatorname{Cov}[X_i, X_j] </math>

per cui <math>1 \le i,j \le k.</math> La matrice [[inversa]] della matrice di covarianza è chiamata matrice di [[Precisione (statistica)|precisione]], e si indica come <math>\boldsymbol{Q}=\boldsymbol\Sigma^{-1}</math>.

=== Vettore aleatorio normale standard ===
Un vettore aleatorio a valori reali <math>\mathbf{X} = (X_1,\ldots,X_k)^{\mathrm T}</math> è detto '''vettore aleatorio normale standard''' se tutte le sue componenti <math>X_n</math> sono indipendenti e ognuna è una variabile aleatoria normale di valore medio nullo e varianza unitaria, cioè se <math>X_n \sim\ \mathcal{N}(0,1)</math> per tutti i valori di <math>n</math>.<ref name="Lapidoth">{{cite book|first=Amos|last=Lapidoth|year=2009|title=A Foundation in Digital Communication|publisher=Cambridge University Press|isbn=978-0-521-19395-5}}</ref>{{rp|p. 454}}

=== Vettore aleatorio normale centrato ===
Un vettore aleatorio a valori reali <math>\mathbf{X} = (X_1,\ldots,X_k)^{\mathrm T}</math> è chiamato '''vettore aleatorio normale centrato''' se esiste una matrice deterministica <math>\boldsymbol{A}</math> di dimensione <math>k \times \ell</math> tale per cui <math>\boldsymbol{A} \mathbf{Z}</math> ha la stessa distribuzione di <math>\mathbf{X}</math> dove <math>\mathbf{Z}</math> è un vettore aleatorio normale standard con <math>\ell</math> componenti.<ref name="Lapidoth" />{{rp|p. 454}}

=== Vettore aleatorio normale ===
Un vettore aleatorio a valori reali <math>\mathbf{X} = (X_1,\ldots,X_k)^{\mathrm T}</math> è detto '''vettore aleatorio normale''' se esistono un vettore aleatorio <math>\ell</math>-dimensionale <math>\mathbf{Z}</math>, che è un vettore aleatorio normale standard, un vettore <math>k</math>-dimensionale <math>\mathbf{\mu}</math>, e una matrice <math>\boldsymbol{A}</math> di dimensione <math>k \times \ell</math>, tale per cui <math>\mathbf{X}=\boldsymbol{A} \mathbf{Z} + \mathbf{\mu}</math>.<ref name="Gut">{{cite book|first=Allan|last=Gut|year=2009|title=An Intermediate Course in Probability|publisher=Springer|isbn=978-1-441-90161-3}}</ref>{{rp|p. 454}}<ref name="Lapidoth" />{{rp|p. 455}}

Formalmente:{{Equation box 1|border|indent=|title=|equation=<math>
\mathbf{X}\ \sim\ \mathcal{N}(\mathbf{\mu}, \boldsymbol\Sigma) \quad \iff \quad \text{there exist } \mathbf{\mu}\in\mathbb{R}^k,\boldsymbol{A}\in\mathbb{R}^{k\times \ell} \text{ such that } \mathbf{X}=\boldsymbol{A} \mathbf{Z} + \mathbf{\mu} \text{ for } Z_n \sim\ \mathcal{N}(0, 1), \text{i.i.d.}
</math>|cellpadding=6|border colour=#0073CF|background colour=#F5FFFA}}Da qui la [[matrice delle covarianze]] è <math>\boldsymbol\Sigma = \boldsymbol{A} \boldsymbol{A}^{\mathrm T}</math>.

Nel caso [[Degenerazione (matematica)|degenere]] in cui la matrice delle covarianze fosse [[Matrice singolare|singolare]], la distribuzione corrispondente non ha densità; vedi la [[Distribuzione normale multivariata|sezione seguente]] per dettagli. Questa situazione capita frequentemente in [[statistica]]; per esempio, nella distribuzione dei vettori dei [[Residuo (analisi complessa)|residui]] nel metodo di regressione dei [[Metodo dei minimi quadrati|minimi quadrati]] ordinario. Le <math>X_i</math> in genere ''non'' sono indipendenti; possono essere visti come il risultato dell'applicazionedella matrice <math>\boldsymbol{A}</math> all'insieme delle variabili gaussiane indipendenti <math>\mathbf{Z}</math>.

=== Definizioni equivalenti ===
Le seguenti definizioni sono equivalenti alla definizione data in precedenza. Un vettore aleatorio <math>\mathbf{X} = (X_1,\ldots,X_k)^T</math> ha una distribuzione normale multivariata se soddisfa una delle seguenti condizioni equivalenti.

* Ogni combinazione lineare <math>Y=a_1 X_1 + \cdots + a_k X_k</math> delle proprie componenti è [[Distribuzione normale|normalmente distribuita]]. Cioè, per un qualunque vettore costante <math>\mathbf{a} \in \mathbb{R}^k</math>, il valore aleatorio <math>Y=\mathbf{a}^{\mathrm T}\mathbf{X}</math> ha una distribuzione normale univariata, dove una distribuzione normale univariata con varianza nulla è un punto materiale sulla sua media.
* Esistono un vettore ''k''-dimensionale <math>\mathbf{\mu}</math> e una matrice di dimensione <math>k \times k</math> simmetrica e [[Matrice definita positiva|positiva semidefinita]] <math>\boldsymbol\Sigma</math>, tali per cui la [[Funzione caratteristica (teoria della probabilità)|funzione caratteristica]] di <math>\mathbf{X}</math> è

:: <math>
\varphi_\mathbf{X}(\mathbf{u}) = \exp\Big( i\mathbf{u}^T\boldsymbol\mu - \tfrac{1}{2} \mathbf{u}^T\boldsymbol\Sigma \mathbf{u} \Big).
</math>
</math>
Il vettore della [[media (statistica)|media]] è
:<math> \mu = [ \operatorname{E}[X_1], \operatorname{E}[X_2], \ldots, \operatorname{E}[X_k]] </math>
e la [[Covarianza (probabilità)|matrice di covarianza]] ''k x k''
:<math> \Sigma = [\operatorname{Cov}[X_i, X_j]]_{i=1,2,\ldots,k; j=1,2,\ldots,k} </math>


La distribuzione normale sferica può essere caratterizzata come l'unica distribuzione in cui le componenti siano indipendenti in un qualunque sistema di coordinate cartesiano.<ref>{{cite journal|last1=Kac|first1=M.|title=On a characterization of the normal distribution|journal=American Journal of Mathematics|date=1939|volume=61|issue=3|pages=726–728|jstor=2371328|doi=10.2307/2371328}}</ref><ref>{{cite journal|last1=Sinz|first1=Fabian|last2=Gerwinn|first2=Sebastian|last3=Bethge|first3=Matthias|title=Characterization of the p-generalized normal distribution|journal=Journal of Multivariate Analysis|date=2009|volume=100|issue=5|pages=817–820|url=|doi=10.1016/j.jmva.2008.07.006}}</ref>
== Definizione ==
Si dice che un vettore di variabili aleatorie <math> X=(X_1,X_2,...X_n) </math> ha densità multivariata normale se soddisfa una delle seguenti condizioni equivalenti:
* Ogni combinazione lineare <math> Y=a_1 X_1 + ... + a_n X_n </math> ha [[distribuzione normale]].
* Esistono un vettore Z di variabili aleatorie di dimensione ''ℓ'' le cui componenti sono indipendenti e hanno distribuzione normale standard, un vettore μ di dimensione ''k'' e una matrice A ''k×ℓ'' tali che <math> X=AZ + \mu </math>
* Esiste un vettore ''μ'' di dimensione k e una [[matrice definita positiva|matrice semidefinita positiva]] <math> \Sigma </math> tali che la [[funzione caratteristica (teoria della probabilità)|funzione caratteristica]] di X sia
::<math>\varphi_X(u) = \exp\Big( iu'\mu - \tfrac{1}{2} u'\Sigma u \Big)</math>


== Voci correlate ==
== Voci correlate ==

Versione delle 04:37, 21 nov 2020

Funzione di densità di una normale multivariata

In teoria della probabilità e statistica, la distribuzione normale multivariata o distribuzione gaussiana multivariata o vettore gaussiano è una generalizzazione della distribuzione normale (univariata) a dimensioni più elevate. Una definizione è che un vettore di variabili aleatorie ha una distribuzione normale k-variata se ogni combinazione lineare delle sue k componenti ha distribuzione normale univariata. La sua importanza deriva principalmente dal teorema del limite centrale multivariato. La distribuzione normale multivariata è spesso utilizzata per descrivere, almeno approssimativamente, un qualunque insieme di variabili aleatorie a valori reali (possibilmente) correlate, ognuna delle quali è clusterizzata attorno ad un valore medio.

Definizioni

Notazione e parametrizzazione

La distribuzione normale multivariata di un vettore aleatorio k-dimensionale può essere scritta secondo la notazione:

o, per rendere esplicito il fatto che sia k-dimensionale,

con un vettore della media d dimensione k

e matrice di covarianza di dimensione

per cui La matrice inversa della matrice di covarianza è chiamata matrice di precisione, e si indica come .

Vettore aleatorio normale standard

Un vettore aleatorio a valori reali è detto vettore aleatorio normale standard se tutte le sue componenti sono indipendenti e ognuna è una variabile aleatoria normale di valore medio nullo e varianza unitaria, cioè se per tutti i valori di .[1]p. 454

Vettore aleatorio normale centrato

Un vettore aleatorio a valori reali è chiamato vettore aleatorio normale centrato se esiste una matrice deterministica di dimensione tale per cui ha la stessa distribuzione di dove è un vettore aleatorio normale standard con componenti.[1]p. 454

Vettore aleatorio normale

Un vettore aleatorio a valori reali è detto vettore aleatorio normale se esistono un vettore aleatorio -dimensionale , che è un vettore aleatorio normale standard, un vettore -dimensionale , e una matrice di dimensione , tale per cui .[2]p. 454[1]p. 455

Formalmente:Template:Equation box 1Da qui la matrice delle covarianze è .

Nel caso degenere in cui la matrice delle covarianze fosse singolare, la distribuzione corrispondente non ha densità; vedi la sezione seguente per dettagli. Questa situazione capita frequentemente in statistica; per esempio, nella distribuzione dei vettori dei residui nel metodo di regressione dei minimi quadrati ordinario. Le in genere non sono indipendenti; possono essere visti come il risultato dell'applicazionedella matrice all'insieme delle variabili gaussiane indipendenti .

Definizioni equivalenti

Le seguenti definizioni sono equivalenti alla definizione data in precedenza. Un vettore aleatorio ha una distribuzione normale multivariata se soddisfa una delle seguenti condizioni equivalenti.

  • Ogni combinazione lineare delle proprie componenti è normalmente distribuita. Cioè, per un qualunque vettore costante , il valore aleatorio ha una distribuzione normale univariata, dove una distribuzione normale univariata con varianza nulla è un punto materiale sulla sua media.
  • Esistono un vettore k-dimensionale e una matrice di dimensione simmetrica e positiva semidefinita , tali per cui la funzione caratteristica di è

La distribuzione normale sferica può essere caratterizzata come l'unica distribuzione in cui le componenti siano indipendenti in un qualunque sistema di coordinate cartesiano.[3][4]

Voci correlate

  1. ^ a b c Amos Lapidoth, A Foundation in Digital Communication, Cambridge University Press, 2009, ISBN 978-0-521-19395-5.
  2. ^ Allan Gut, An Intermediate Course in Probability, Springer, 2009, ISBN 978-1-441-90161-3.
  3. ^ On a characterization of the normal distribution, in American Journal of Mathematics, vol. 61, n. 3, 1939, pp. 726–728, DOI:10.2307/2371328.
  4. ^ Characterization of the p-generalized normal distribution, in Journal of Multivariate Analysis, vol. 100, n. 5, 2009, pp. 817–820, DOI:10.1016/j.jmva.2008.07.006.