Distribuzione multinomiale

Da Wikipedia, l'enciclopedia libera.

In teoria delle probabilità la distribuzione multinomiale è una distribuzione di probabilità discreta che generalizza la distribuzione binomiale in più variabili.

In altri termini, laddove la distribuzione binomiale descrive il numero di successi in un processo di Bernoulli, per il quale ogni singola prova può fornire due soli risultati, la distribuzione multinomiale descrive il caso in cui ogni prova possa fornire diversi risultati (con diverse probabilità).

Un esempio di distribuzione multinomiale è dato dal numero di occorrenze di ogni faccia per alcuni lanci successivi di un dado a 6 facce.

Definizione[modifica | modifica wikitesto]

Distribuzione binomiale[modifica | modifica wikitesto]

La distribuzione binomiale \mathcal{B}(p,n) descrive le probabilità per ogni coppia (k,n-k) ("successi", "fallimenti") in n prove indipendenti, ognuna delle quali ha probabilità p e 1-p di fornire un "successo" o un "fallimento".

Distribuzione multinomiale[modifica | modifica wikitesto]

La distribuzione multinomiale di parametri ((p_1,...,p_s),n), con p_1+...+p_s=1, descrive le probabilità per ogni s-upla (n_1,...,n_s) (con n_1+...+n_s=n) di risultati x_1,...,x_s in n prove indipendenti, ognuna delle quali ha probabilità p_i di fornire x_i.

Questa distribuzione può essere descritta prendendo un vettore aleatorio X_j per i risultati di ogni singola prova, con

P(X_j=e_i)=p_i,

dove \{e_1,...,e_s\} è la base canonica per \mathbb{R}^s, e_1=(1,0,...,0),... ,e_s=(0,...,0,1). La distribuzione binomiale descrive allora la variabile aleatoria S=X_1+...+X_n.

Probabilità[modifica | modifica wikitesto]

La funzione di probabilità della distribuzione multinomiale di parametri ((p_1,...,p_s),n), con p_1+...+p_s=1, è

P(n_1,...,n_s)=\binom{n}{n_1,...,n_s}\prod_i p_i^{n_i}=\frac{n!}{n_1!\cdots n_s!}p_1^{n_1}\cdots p_s^{n_s} per tutte le s-uple (n_1,...,n_s)\in\{0,1,..,n\}^s con n_1+...+n_s=n.

Qui il coefficiente multinomiale \textstyle\binom{n}{n_1,...,n_s} "conta" il numero di possibili sequenze con n_1 risultati x_1, n_2 risultati x_2 e così via. Il prodotto \textstyle\prod_ip_i^{n_i} fornisce la probabilità di ognuna di queste sequenze.

Il teorema multinomiale mostra come la probabilità totale sia pari a 1:

\sum_{n_1+...+n_s=n}P(n_1,...,n_s)=(p_1+...+p_n)^n=1^n=1.

Caratteristiche[modifica | modifica wikitesto]

Caso binomiale[modifica | modifica wikitesto]

La distribuzione binomiale di parametri (p,n) è una distribuzione multinomiale di parametri ((p,1-p),n).

Se il vettore aleatorio S=(S_1,...,S_s) segue la distribuzione multinomiale di parametri ((p_1,...,p_s),n) allora ogni sua coordinata S_i è una variabile aleatoria che segue la distribuzione binomiale (p_i,n). In altri termini ogni coordinata i considera i "successi" dell'evento x_i.

Indici[modifica | modifica wikitesto]

Molte degli usuali indici di una distribuzione su \mathbb{R} non si estendono al caso multidimensionale.

La speranza matematica del vettore aleatorio S (definita come somma pesata dei possibili vettori) per trasformazione lineare ha come componenti le speranze delle componenti ed è pari a n volte la speranza di una singola prova:

E[S]=\big(E[S_1],...,E[S_s]\big)=nE[X]=n(p_1,...,p_s)=(np_1,...,np_s).

Come nel caso binomiale la matrice delle covarianze di S=(S_1,...,S_s) (la matrice s\times s con elementi m_{i,j}=\text{cov}(S_i,S_j)) è pari a n volte la matrice delle covarianze di una singola prova X, dunque è data da

m_{i,i}=n\,\text{Var}(X_i)=np_i(1-p_i)
m_{i,j}=n\,\text{cov}(X_i,X_j)=-np_ip_j se i\neq j.

Distribuzioni correlate[modifica | modifica wikitesto]

Nella statistica bayesiana la distribuzione di Dirichlet è una coniugata della distribuzione multinomiale. Più precisamente, se il parametro (p_1,...,p_s) di una distribuzione multinomiale segue una distribuzione di Dirichlet di parametro \alpha=(\alpha_1,...,\alpha_s) allora la sua distribuzione condizionata dall'evento S=\sigma=(n_1,...,n_s) segue ancora una distribuzione di Dirichlet, di parametro \alpha+\sigma=(\alpha_1+n_1+...+\alpha_s+n_s). (La distribuzione di Dirichlet è la generalizzazione multivariata della distribuzione Beta, che svolge lo stesso ruolo per la distribuzione binomiale.)

Il test del \chi^2 di adeguamento può essere descritto a partire dalla distribuzione multinomiale, poiché per valori "grandi" di n la distribuzione di ogni componente S_i (centrata e ridotta) viene approssimata da una distribuzione normale (standard).

Esempio[modifica | modifica wikitesto]

Il numero di risultati "1", "2", "3", "4", "5" e "6" per n lanci di un dado equilibrato a 6 facce è descritto dalla distribuzione multinomiale di parametri ((\tfrac{1}{6},\tfrac{1}{6},\tfrac{1}{6},\tfrac{1}{6},\tfrac{1}{6},\tfrac{1}{6}),n).

Un diverso esempio è dato dall'estrazione (con reinserimento) di una pallina da un'urna che contenga palline di diversi colori. Per un'urna con sei palline, di cui una verde, due bianche e tre blu, si hanno i parametri (p_1,p_2,p_3)=(\tfrac{1}{6},\tfrac{1}{3},\tfrac{1}{2}); il risultato di cinque estrazioni (con reinserimento della pallina estratta) è descritto dalla distribuzione multinomiale di parametri ((\tfrac{1}{6},\tfrac{1}{3},\tfrac{1}{2}),5).
Per calcolare la probabilità che la pallina estratta sia due volte verde, una volta bianca e due volte blu basta calcolare la probabilità

P(2,1,2)=\binom{5}{2,1,2}\left(\frac{1}{6}\right)^2\left(\frac{1}{3}\right)^1\left(\frac{1}{2}\right)^2=\frac{5!}{2!\,1!\,2!}\frac{1}{6^2}\frac{1}{3}\frac{1}{2^2}=\frac{5}{72}\approx 7%
matematica Portale Matematica: accedi alle voci di Wikipedia che trattano di matematica