Distribuzione di Dirichlet

Da Wikipedia, l'enciclopedia libera.

In teoria della probabilità la distribuzione di Dirichlet, spesso denotata con \operatorname{Dir}(\boldsymbol\alpha), è una distribuzione di probabilità continua, dipendente da un vettore di numeri reali positivi \alpha, che generalizza la variabile casuale Beta nel caso multivariato. Prende il nome dal matematico tedesco Peter Gustav Lejeune Dirichlet.

Ha come funzione di densità di probabilità

f(x_1, x_2, \ldots, x_k | \alpha_1, \alpha_2, \ldots, \alpha_k) = \frac{\Gamma(\alpha)}{\Gamma(\alpha_1) \Gamma(\alpha_2) \ldots \Gamma(\alpha_k)} x_1^{\alpha_1-1} x_2^{\alpha_2-1} \ldots x_k^{\alpha_k-1},

dove \alpha=\alpha_1+\alpha_2+\ldots+\alpha_k e x_1,\dots, x_k sono numeri reali positivi tali che

x_1+\cdots+ x_k=1.

Il suo valore atteso è

E(X_i)=\frac{\alpha_i}{\alpha},

la moda è

 x_i = \frac{\alpha_i - 1}{\alpha - k}, \quad \alpha_i > 1,

mentre la varianza è

Var(X_i)=\frac{(\alpha-\alpha_i)\alpha_i}{\alpha^2(\alpha+1)}.

Inoltre, per ogni coppia X_i, X_j con i \ne j, si ha che la covarianza è

Cov(X_i,X_j)=-\frac{\alpha_i\alpha_j}{\alpha^2(\alpha+1)}.


Teoremi[modifica | modifica wikitesto]

La distribuzione Beta come caso particolare[modifica | modifica wikitesto]

Se k=2, X_2=1-X_1, allora X_1 è distribuita come una variabile casuale Beta Beta(\alpha_1,\alpha_2)

La distribuzione di Dirichlet come prior coniugate della v.c.Multinomiale[modifica | modifica wikitesto]

Nell'ambito dell'inferenza bayesiana la variabile casuale di Dirichlet è una prior coniugate della variabile casuale multinomiale in quanto se si applica alla

f(x_1,x_2, \ldots,x_k|\theta_1, \theta_2, \ldots,\theta_k)=\operatorname{Multinomiale}_k(\theta_1, \theta_2, \ldots,\theta_k)

una distribuzione a priori delle θ corrispondente ad una variabile casuale di Dirichlet

g(\theta_1, \theta_2, \ldots,\theta_k)=\operatorname{Dir}_k( \alpha_1, \alpha_2, \ldots, \alpha_k)

allora la distribuzione a posteriori delle θ è anch'essa una variabile casuale di Dirichlet, ma con i parametri incrementati dai valori osservati

g(\theta_1, \theta_2, \ldots,\theta_k|(x_1,x_2,\ldots,x_k)=\operatorname{Dir}_k( \alpha_1+x_1, \alpha_2+x_2,  \ldots, \alpha_k+x_k)

Questo teorema può essere visto come una generalizzazione multivariata dell'equivalente teorema univariato, che coinvolge variabile casuale binomiale al posto della multinomiale e la variabile casuale Beta al posto della Dirichlet.

Dalla Gamma (Erlang B) alla Dirichlet[modifica | modifica wikitesto]

Se si hanno k indipendenti variabili casuali distribuite ciascuna come una variabile casuale Gamma con un parametro comune a tutti e unitario e un parametro individualizzato (si tratta dunque di variabili casuali dette Erlang B, ciascuna con il proprio parametro)

Y_i\sim\operatorname{Gamma}(1,\alpha_i)

definendo la loro somma come

V=\sum_{i=1}^k Y_i\sim\operatorname{Gamma}(1, \sum_{i=1}^k\alpha_i),

allora si ha che

(X_1,\ldots,X_k) = (Y_1/V,\ldots,Y_k/V)\sim \operatorname{Dir_k}(\alpha_1,\ldots,\alpha_k).
matematica Portale Matematica: accedi alle voci di Wikipedia che trattano di matematica