Mistura di distribuzioni

Da Wikipedia, l'enciclopedia libera.

Una mistura di distribuzioni è una variabile casuale la cui funzione di probabilità (nel caso di una variabile casuale discreta) o funzione di densità di probabilità (nel caso di una variabile casuale continua) è data da una media ponderata di funzioni di probabilità o densità di altre variabili casuali.

Nel caso di una mistura finita di distribuzioni continue la funzione di densità di probabilità (f.d.p.) è descritta in generale da

f(x;\pi_1,\dots,\pi_k,g_1,\dots,g_k)=\sum_{i=1}^k\pi_i g_i(x)

con il vincolo che \Sigma_{i=1}^k\pi_i =1 e dove gi sono k f.d.p., le quali possono a loro volta avere dei parametri che le caratterizzano.

Ad esempio una mistura di due distribuzioni normali ha come funzione di densità di probabilità

f(x11122) = π1φ(x11) + π2φ(x22)

dove π2 = 1 − π1 e φ(x;μ,σ) è la funzione di densità di probabilità di una variabile casuale normale.

Un teorema di rappresenzazione di Lebesgue assicura che ogni variabile casuale è rappresentabile come mistura di distribuzioni del tipo continuo e/o discreto e/o singolare.

Uno dei casi nei quali si ricorre ad un mistura di distribuzioni è quello delle subpopolazioni, ovvero quando una popolazione (di valori) è composta da più sottopopolazioni ciascuna con una propria distribuzione dei valori. Ad esempio, se si ritiene che sia l'altezza degli uomini che l'altezza delle donne è distribuita come una normale ma con la media per gli uomini maggiore della media delle donne, allora l'altezza degli individui senza distinzione di sesso è una mistura di due distribuzioni normali.

[modifica] Voci correlate


Strumenti personali
Altre lingue