In teoria della probabilità la distribuzione di Dirichlet, spesso denotata con
, è una distribuzione di probabilità continua, dipendente da un vettore di numeri reali positivi
, che generalizza la variabile casuale Beta nel caso multivariato. Prende il nome dal matematico tedesco Peter Gustav Lejeune Dirichlet.
Ha come funzione di densità di probabilità
![{\displaystyle f(x_{1},x_{2},\ldots ,x_{k}|\alpha _{1},\alpha _{2},\ldots ,\alpha _{k})={\frac {\Gamma (\alpha )}{\Gamma (\alpha _{1})\Gamma (\alpha _{2})\ldots \Gamma (\alpha _{k})}}x_{1}^{\alpha _{1}-1}x_{2}^{\alpha _{2}-1}\ldots x_{k}^{\alpha _{k}-1},}](https://wikimedia.org/api/rest_v1/media/math/render/svg/11afecf0265304c8b9b3349e74d0ae5ce6702592)
dove
e
sono numeri reali positivi tali che
![{\displaystyle x_{1}+\cdots +x_{k}=1.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/f57e6aa7a57f8f2fc0ee52efa8e1a4098b2c9ad4)
Il suo valore atteso è
![{\displaystyle E(X_{i})={\frac {\alpha _{i}}{\alpha }},}](https://wikimedia.org/api/rest_v1/media/math/render/svg/0e96d5aec9bb5ef7c4398b0663496178f124ae2d)
la moda è
![{\displaystyle x_{i}={\frac {\alpha _{i}-1}{\alpha -k}},\quad \alpha _{i}>1,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/9359ac3339a667c2cbbea0b6bc6967132544879d)
mentre la varianza è
![{\displaystyle \operatorname {Var} (X_{i})={\frac {(\alpha -\alpha _{i})\alpha _{i}}{\alpha ^{2}(\alpha +1)}}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/e528847af24b9d541dea0e1d4a96a1643ad3a6fe)
Inoltre, per ogni coppia
con
, si ha che la covarianza è
![{\displaystyle \operatorname {Cov} (X_{i},X_{j})=-{\frac {\alpha _{i}\alpha _{j}}{\alpha ^{2}(\alpha +1)}}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/bf2d6df139f0164f1ad0416332e92d458ad9e946)
Se
e
, allora
è distribuita come una variabile casuale Beta
La distribuzione di Dirichlet come distribuzione a priori coniugata della distribuzione Multinomiale
[modifica | modifica wikitesto]
Nell'ambito dell'inferenza bayesiana la variabile casuale di Dirichlet è una distribuzione a priori coniugata della variabile casuale multinomiale in quanto se si applica alla
![{\displaystyle f(x_{1},x_{2},\ldots ,x_{k}|\theta _{1},\theta _{2},\ldots ,\theta _{k})=\operatorname {Multinomiale} _{k}(\theta _{1},\theta _{2},\ldots ,\theta _{k})}](https://wikimedia.org/api/rest_v1/media/math/render/svg/5712eb3f5205b0782092acb86e7768ebff21b50a)
una distribuzione a priori delle
corrispondente ad una variabile casuale di Dirichlet
![{\displaystyle g(\theta _{1},\theta _{2},\ldots ,\theta _{k})=\operatorname {Dir} _{k}(\alpha _{1},\alpha _{2},\ldots ,\alpha _{k}),}](https://wikimedia.org/api/rest_v1/media/math/render/svg/e502cc389b66e3d678d4324fd140af100e16ac51)
allora la distribuzione a posteriori delle
è anch'essa una variabile casuale di Dirichlet, ma con i parametri incrementati dai valori osservati:
![{\displaystyle g(\theta _{1},\theta _{2},\ldots ,\theta _{k}|(x_{1},x_{2},\ldots ,x_{k})=\operatorname {Dir} _{k}(\alpha _{1}+x_{1},\alpha _{2}+x_{2},\ldots ,\alpha _{k}+x_{k}).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/8949cfa5154d2db5884e12bf87ead82fc3e12773)
Questo teorema può essere visto come una generalizzazione multivariata dell'equivalente teorema univariato, che coinvolge variabile casuale binomiale al posto della multinomiale e la variabile casuale Beta al posto della Dirichlet.
Se si hanno
indipendenti variabili casuali distribuite ciascuna come una variabile casuale Gamma con un parametro comune a tutti e unitario e un parametro individualizzato (si tratta dunque di variabili casuali dette Erlang B, ciascuna con il proprio parametro)
![{\displaystyle Y_{i}\sim \operatorname {Gamma} (\alpha _{i},1),}](https://wikimedia.org/api/rest_v1/media/math/render/svg/89b234c8c1c77020fd4ca85a4484499d46db15ad)
definendo la loro somma come
![{\displaystyle V=\sum _{i=1}^{k}Y_{i}\sim \operatorname {Gamma} (\sum _{i=1}^{k}\alpha _{i},1),}](https://wikimedia.org/api/rest_v1/media/math/render/svg/9d0f67b908f9915837787e39691d75003b8b6b19)
allora si ha che
![{\displaystyle (X_{1},\ldots ,X_{k})=(Y_{1}/V,\ldots ,Y_{k}/V)\sim \operatorname {Dir_{k}} (\alpha _{1},\ldots ,\alpha _{k}).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/c82a30a136472709d9d04ed324742a39851c7e85)
- SciencesPo: pacchetto R che contiene funzioni per la simulazione di parametri della distribuzione Dirichlet.