Distribuzione normale multivariata: differenze tra le versioni
m →Notazione: smistamento lavoro sporco e fix vari |
Tradotto la parte in inglese della pagina di Wikipedia corrispondente italiana |
||
Riga 1: | Riga 1: | ||
{{F|matematica|arg2=statistica|febbraio 2014}} |
{{F|matematica|arg2=statistica|febbraio 2014}} |
||
[[File:BivariateNormalDifferentVolas.png|thumb|Funzione di densità di una normale multivariata]] |
[[File:BivariateNormalDifferentVolas.png|thumb|Funzione di densità di una normale multivariata]] |
||
In [[teoria della probabilità]] e [[statistica]], la '''distribuzione normale multivariata''' o '''distribuzione gaussiana multivariata''' o '''vettore gaussiano''' è una generalizzazione della [[distribuzione normale]] a dimensioni più elevate. |
In [[teoria della probabilità]] e [[statistica]], la '''distribuzione normale multivariata''' o '''distribuzione gaussiana multivariata''' o '''vettore gaussiano''' è una generalizzazione della [[distribuzione normale]] (univariata) a dimensioni più elevate. Una definizione è che un [[Variabile casuale multivariata|vettore di variabili aleatorie]] ha una distribuzione normale k-variata se ogni [[combinazione lineare]] delle sue k componenti ha distribuzione normale univariata. La sua importanza deriva principalmente dal [[teorema del limite centrale multivariato]]. La distribuzione normale multivariata è spesso utilizzata per descrivere, almeno approssimativamente, un qualunque insieme di [[Variabile casuale|variabili aleatorie]] a valori reali (possibilmente) [[Correlazione (statistica)|correlate]], ognuna delle quali è clusterizzata attorno ad un valore medio. |
||
== Definizioni == |
|||
⚫ | |||
La distribuzione normale multivariata di un vettore aleatorio k-dimensionale <math>\mathbf{X} = (X_1,\ldots,X_k)^{\mathrm T}</math> può essere scritta secondo la notazione: |
|||
⚫ | |||
La distribuzione normale multivariata di un vettore di variabili aleatorie ''k''-dimensionale {{Tutto attaccato|''X'' {{=}} [''X''<sub>1</sub>, ''X''<sub>2</sub>, …, ''X<sub>k</sub>'']}} viene indicata con la seguente notazione: |
|||
: <math> |
: <math> |
||
X\ \sim\ \mathcal{N}(\mu,\, \Sigma), |
\mathbf{X}\ \sim\ \mathcal{N}(\boldsymbol\mu,\, \boldsymbol\Sigma), |
||
</math> |
</math> |
||
oppure, per esplicitare la dimensione del vettore: |
|||
o, per rendere esplicito il fatto che <math>\mathbf{X}</math> sia k-dimensionale, |
|||
: <math> |
: <math> |
||
X\ \sim\ \mathcal{N}_k(\mu,\, \Sigma) |
\mathbf{X}\ \sim\ \mathcal{N}_k(\boldsymbol\mu,\, \boldsymbol\Sigma), |
||
</math> |
|||
⚫ | |||
⚫ | |||
⚫ | |||
: <math> \Sigma_{i,j} := \operatorname{E} [(X_i - \mu_i)( X_j - \mu_j)] = \operatorname{Cov}[X_i, X_j] </math> |
|||
per cui <math>1 \le i,j \le k.</math> La matrice [[inversa]] della matrice di covarianza è chiamata matrice di [[Precisione (statistica)|precisione]], e si indica come <math>\boldsymbol{Q}=\boldsymbol\Sigma^{-1}</math>. |
|||
=== Vettore aleatorio normale standard === |
|||
Un vettore aleatorio a valori reali <math>\mathbf{X} = (X_1,\ldots,X_k)^{\mathrm T}</math> è detto '''vettore aleatorio normale standard''' se tutte le sue componenti <math>X_n</math> sono indipendenti e ognuna è una variabile aleatoria normale di valore medio nullo e varianza unitaria, cioè se <math>X_n \sim\ \mathcal{N}(0,1)</math> per tutti i valori di <math>n</math>.<ref name="Lapidoth">{{cite book|first=Amos|last=Lapidoth|year=2009|title=A Foundation in Digital Communication|publisher=Cambridge University Press|isbn=978-0-521-19395-5}}</ref>{{rp|p. 454}} |
|||
=== Vettore aleatorio normale centrato === |
|||
Un vettore aleatorio a valori reali <math>\mathbf{X} = (X_1,\ldots,X_k)^{\mathrm T}</math> è chiamato '''vettore aleatorio normale centrato''' se esiste una matrice deterministica <math>\boldsymbol{A}</math> di dimensione <math>k \times \ell</math> tale per cui <math>\boldsymbol{A} \mathbf{Z}</math> ha la stessa distribuzione di <math>\mathbf{X}</math> dove <math>\mathbf{Z}</math> è un vettore aleatorio normale standard con <math>\ell</math> componenti.<ref name="Lapidoth" />{{rp|p. 454}} |
|||
=== Vettore aleatorio normale === |
|||
Un vettore aleatorio a valori reali <math>\mathbf{X} = (X_1,\ldots,X_k)^{\mathrm T}</math> è detto '''vettore aleatorio normale''' se esistono un vettore aleatorio <math>\ell</math>-dimensionale <math>\mathbf{Z}</math>, che è un vettore aleatorio normale standard, un vettore <math>k</math>-dimensionale <math>\mathbf{\mu}</math>, e una matrice <math>\boldsymbol{A}</math> di dimensione <math>k \times \ell</math>, tale per cui <math>\mathbf{X}=\boldsymbol{A} \mathbf{Z} + \mathbf{\mu}</math>.<ref name="Gut">{{cite book|first=Allan|last=Gut|year=2009|title=An Intermediate Course in Probability|publisher=Springer|isbn=978-1-441-90161-3}}</ref>{{rp|p. 454}}<ref name="Lapidoth" />{{rp|p. 455}} |
|||
Formalmente:{{Equation box 1|border|indent=|title=|equation=<math> |
|||
\mathbf{X}\ \sim\ \mathcal{N}(\mathbf{\mu}, \boldsymbol\Sigma) \quad \iff \quad \text{there exist } \mathbf{\mu}\in\mathbb{R}^k,\boldsymbol{A}\in\mathbb{R}^{k\times \ell} \text{ such that } \mathbf{X}=\boldsymbol{A} \mathbf{Z} + \mathbf{\mu} \text{ for } Z_n \sim\ \mathcal{N}(0, 1), \text{i.i.d.} |
|||
</math>|cellpadding=6|border colour=#0073CF|background colour=#F5FFFA}}Da qui la [[matrice delle covarianze]] è <math>\boldsymbol\Sigma = \boldsymbol{A} \boldsymbol{A}^{\mathrm T}</math>. |
|||
Nel caso [[Degenerazione (matematica)|degenere]] in cui la matrice delle covarianze fosse [[Matrice singolare|singolare]], la distribuzione corrispondente non ha densità; vedi la [[Distribuzione normale multivariata|sezione seguente]] per dettagli. Questa situazione capita frequentemente in [[statistica]]; per esempio, nella distribuzione dei vettori dei [[Residuo (analisi complessa)|residui]] nel metodo di regressione dei [[Metodo dei minimi quadrati|minimi quadrati]] ordinario. Le <math>X_i</math> in genere ''non'' sono indipendenti; possono essere visti come il risultato dell'applicazionedella matrice <math>\boldsymbol{A}</math> all'insieme delle variabili gaussiane indipendenti <math>\mathbf{Z}</math>. |
|||
=== Definizioni equivalenti === |
|||
Le seguenti definizioni sono equivalenti alla definizione data in precedenza. Un vettore aleatorio <math>\mathbf{X} = (X_1,\ldots,X_k)^T</math> ha una distribuzione normale multivariata se soddisfa una delle seguenti condizioni equivalenti. |
|||
* Ogni combinazione lineare <math>Y=a_1 X_1 + \cdots + a_k X_k</math> delle proprie componenti è [[Distribuzione normale|normalmente distribuita]]. Cioè, per un qualunque vettore costante <math>\mathbf{a} \in \mathbb{R}^k</math>, il valore aleatorio <math>Y=\mathbf{a}^{\mathrm T}\mathbf{X}</math> ha una distribuzione normale univariata, dove una distribuzione normale univariata con varianza nulla è un punto materiale sulla sua media. |
|||
⚫ | * Esistono un vettore ''k''-dimensionale <math>\mathbf{\mu}</math> e una matrice di dimensione <math>k \times k</math> simmetrica e [[Matrice definita positiva|positiva semidefinita]] <math>\boldsymbol\Sigma</math>, tali per cui la [[Funzione caratteristica (teoria della probabilità)|funzione caratteristica]] di <math>\mathbf{X}</math> è |
||
:: <math> |
|||
\varphi_\mathbf{X}(\mathbf{u}) = \exp\Big( i\mathbf{u}^T\boldsymbol\mu - \tfrac{1}{2} \mathbf{u}^T\boldsymbol\Sigma \mathbf{u} \Big). |
|||
</math> |
</math> |
||
⚫ | |||
⚫ | |||
⚫ | |||
:<math> \Sigma = [\operatorname{Cov}[X_i, X_j]]_{i=1,2,\ldots,k; j=1,2,\ldots,k} </math> |
|||
La distribuzione normale sferica può essere caratterizzata come l'unica distribuzione in cui le componenti siano indipendenti in un qualunque sistema di coordinate cartesiano.<ref>{{cite journal|last1=Kac|first1=M.|title=On a characterization of the normal distribution|journal=American Journal of Mathematics|date=1939|volume=61|issue=3|pages=726–728|jstor=2371328|doi=10.2307/2371328}}</ref><ref>{{cite journal|last1=Sinz|first1=Fabian|last2=Gerwinn|first2=Sebastian|last3=Bethge|first3=Matthias|title=Characterization of the p-generalized normal distribution|journal=Journal of Multivariate Analysis|date=2009|volume=100|issue=5|pages=817–820|url=|doi=10.1016/j.jmva.2008.07.006}}</ref> |
|||
== Definizione == |
|||
Si dice che un vettore di variabili aleatorie <math> X=(X_1,X_2,...X_n) </math> ha densità multivariata normale se soddisfa una delle seguenti condizioni equivalenti: |
|||
* Ogni combinazione lineare <math> Y=a_1 X_1 + ... + a_n X_n </math> ha [[distribuzione normale]]. |
|||
* Esistono un vettore Z di variabili aleatorie di dimensione ''ℓ'' le cui componenti sono indipendenti e hanno distribuzione normale standard, un vettore μ di dimensione ''k'' e una matrice A ''k×ℓ'' tali che <math> X=AZ + \mu </math> |
|||
⚫ | |||
::<math>\varphi_X(u) = \exp\Big( iu'\mu - \tfrac{1}{2} u'\Sigma u \Big)</math> |
|||
== Voci correlate == |
== Voci correlate == |
Versione delle 04:37, 21 nov 2020
In teoria della probabilità e statistica, la distribuzione normale multivariata o distribuzione gaussiana multivariata o vettore gaussiano è una generalizzazione della distribuzione normale (univariata) a dimensioni più elevate. Una definizione è che un vettore di variabili aleatorie ha una distribuzione normale k-variata se ogni combinazione lineare delle sue k componenti ha distribuzione normale univariata. La sua importanza deriva principalmente dal teorema del limite centrale multivariato. La distribuzione normale multivariata è spesso utilizzata per descrivere, almeno approssimativamente, un qualunque insieme di variabili aleatorie a valori reali (possibilmente) correlate, ognuna delle quali è clusterizzata attorno ad un valore medio.
Definizioni
Notazione e parametrizzazione
La distribuzione normale multivariata di un vettore aleatorio k-dimensionale può essere scritta secondo la notazione:
o, per rendere esplicito il fatto che sia k-dimensionale,
con un vettore della media d dimensione k
e matrice di covarianza di dimensione
per cui La matrice inversa della matrice di covarianza è chiamata matrice di precisione, e si indica come .
Vettore aleatorio normale standard
Un vettore aleatorio a valori reali è detto vettore aleatorio normale standard se tutte le sue componenti sono indipendenti e ognuna è una variabile aleatoria normale di valore medio nullo e varianza unitaria, cioè se per tutti i valori di .[1]p. 454
Vettore aleatorio normale centrato
Un vettore aleatorio a valori reali è chiamato vettore aleatorio normale centrato se esiste una matrice deterministica di dimensione tale per cui ha la stessa distribuzione di dove è un vettore aleatorio normale standard con componenti.[1]p. 454
Vettore aleatorio normale
Un vettore aleatorio a valori reali è detto vettore aleatorio normale se esistono un vettore aleatorio -dimensionale , che è un vettore aleatorio normale standard, un vettore -dimensionale , e una matrice di dimensione , tale per cui .[2]p. 454[1]p. 455
Formalmente:Template:Equation box 1Da qui la matrice delle covarianze è .
Nel caso degenere in cui la matrice delle covarianze fosse singolare, la distribuzione corrispondente non ha densità; vedi la sezione seguente per dettagli. Questa situazione capita frequentemente in statistica; per esempio, nella distribuzione dei vettori dei residui nel metodo di regressione dei minimi quadrati ordinario. Le in genere non sono indipendenti; possono essere visti come il risultato dell'applicazionedella matrice all'insieme delle variabili gaussiane indipendenti .
Definizioni equivalenti
Le seguenti definizioni sono equivalenti alla definizione data in precedenza. Un vettore aleatorio ha una distribuzione normale multivariata se soddisfa una delle seguenti condizioni equivalenti.
- Ogni combinazione lineare delle proprie componenti è normalmente distribuita. Cioè, per un qualunque vettore costante , il valore aleatorio ha una distribuzione normale univariata, dove una distribuzione normale univariata con varianza nulla è un punto materiale sulla sua media.
- Esistono un vettore k-dimensionale e una matrice di dimensione simmetrica e positiva semidefinita , tali per cui la funzione caratteristica di è
La distribuzione normale sferica può essere caratterizzata come l'unica distribuzione in cui le componenti siano indipendenti in un qualunque sistema di coordinate cartesiano.[3][4]
Voci correlate
- ^ a b c Amos Lapidoth, A Foundation in Digital Communication, Cambridge University Press, 2009, ISBN 978-0-521-19395-5.
- ^ Allan Gut, An Intermediate Course in Probability, Springer, 2009, ISBN 978-1-441-90161-3.
- ^ On a characterization of the normal distribution, in American Journal of Mathematics, vol. 61, n. 3, 1939, pp. 726–728, DOI:10.2307/2371328.
- ^ Characterization of the p-generalized normal distribution, in Journal of Multivariate Analysis, vol. 100, n. 5, 2009, pp. 817–820, DOI:10.1016/j.jmva.2008.07.006.