Distribuzione binomiale

Da Wikipedia, l'enciclopedia libera.
(Reindirizzamento da Distribuzione Binomiale)
Distribuzione binomiale \mathcal{B}(n,p)
Funzione di distribuzione discreta
Funzione di probabilità
Funzione di ripartizione
Funzione di ripartizione
Parametri \begin{array}{l} p\in ]0,1[ \\ q=1-p \in ]0,1[\\ n\in\mathbb{N}\end{array}
Supporto \{0, 1, ..., n\}\
Funzione di densità \textstyle {n\choose k} p^k q^{n-k}
Funzione di ripartizione I_q(n-k,k+1)
(funzione Beta incompleta regolarizzata)
Valore atteso np\
Mediana tra \lfloor np\rfloor e \lceil np\rceil
(non precisa)
Moda [p(n+1)] se p(n+1)\not\in\mathbb{N}
Varianza npq\
Indice di asimmetria \frac{q-p}{\sqrt{npq}}
Curtosi \frac{1-6pq}{npq}
Entropia
Funzione generatrice dei momenti (q+pe^t)^n\
Funzione caratteristica (q+pe^{it})^n\

In teoria della probabilità la distribuzione binomiale è una distribuzione di probabilità discreta che descrive il numero di successi in un processo di Bernoulli, ovvero la variabile aleatoria S_n=X_1+X_2+\ldots+X_n che somma n variabili aleatorie indipendenti di uguale distribuzione di Bernoulli \mathcal{B}(p).

Esempi di casi di distribuzione binomiale sono i risultati di una serie di lanci di una stessa moneta o di una serie di estrazioni da un'urna (con reintroduzione), ognuna delle quali può fornire due soli risultati: il successo con probabilità p e il fallimento con probabilità q=1-p.

Definizione[modifica | modifica sorgente]

La distribuzione binomiale \mathcal{B}(n,p) è caratterizzata da due parametri:[1]

  • n: il numero di prove effettuate.
  • p: la probabilità di successo della singola prova di Bernoulli X_i (con 0 \le p \le 1).

Per semplicità di notazione viene solitamente utilizzato anche il parametro q=1-p, che esprime la probabilità di fallimento per una singola prova.

La distribuzione di probabilità è:

P(k)\ =\ P(X_1+X_2+\ldots+X_n=k)\ =\ {n \choose k} p^k q^{n - k}

cioè ogni successione con k successi e n-k insuccessi ha probabilità p^kq^{n-k}, mentre il numero di queste successioni, pari al numero di modi (o combinazioni) in cui possono essere disposti i k successi negli n tentativi, è dato dal coefficiente binomiale \textstyle {n \choose k} = \frac{n!}{k!(n-k)!}.

La formula del binomio di Newton mostra come la somma di tutte le probabilità nella distribuzione sia uguale a 1:

\sum_{k=0}^{n} P(S_n=k) =  \sum_{k=0}^{n} {n \choose k} p^k q^{n - k} = (p+q)^n = (p + 1 - p)^n = (1)^n = 1

Esempio[modifica | modifica sorgente]

Per calcolare la probabilità di ottenere con 5 lanci di un dado (equilibrato a 6 facce) esattamente 3 volte "4", basta considerare i lanci come un processo di Bernoulli.

Ogni singola prova ha probabilità p=1/6 di ottenere "4" (successo) e probabilità q=5/6 di non ottenerlo (insuccesso). Il numero di successi con 5 prove è allora descritto da una variabile aleatoria S5 di legge B(5,1/6).

La probabilità di ottenere esattamente 3 volte "4" con 5 lanci (e 2 volte "non 4") è

P(S_5=3)\ =\ {5\choose3}\ (1/6)^3\ (5/6)^2\ =\ 10\ (1/6)^3\ (5/6)^2\ =\ 0,032...

Caratteristiche[modifica | modifica sorgente]

Siccome la distribuzione binomiale \mathcal{B}(n,p) descrive una variabile aleatoria S_n definita come la somma di n variabili aleatorie indipendenti X_i di uguale legge di Bernoulli \mathcal{B}(p), molte caratteristiche di S_n possono essere ricavate da quelle di X:

E[S_n]\ =\ \sum_{i=1}^n E[X_i]\ =\ nE[X]\ =\ np
\text{Var}(S_n)\ =\ \sum_{i=1}^n \text{Var}(X_i)\ =\ n\text{Var}(X)\ =\ npq
g(S_n,t)\ =\ \prod_{i=1}^n g(X_i,t) \ =\ g(X,t)^n\ =\ (q+pe^t)^n
\phi_{S_n}(t)\ =\ \prod_{i=1}^n \phi_{X_i}(t) \ =\ \phi_{X}(t)^n\ =\ (q+pe^{it})^n
\gamma_1\ =\ \frac{q-p}{\sqrt{npq}}
\gamma_2\ =\ \frac{1}{n}\left(\frac{1}{pq}-6\right)

La moda di S_n si ottiene confrontando le probabilità successive P(k+1)/P(k). Se p(n+1) è un numero intero allora P(p(n+1))=P(p(n+1)-1) e la moda non è unica; se invece p(n+1) non è un intero allora la moda è pari alla sua parte intera [p(n+1)].

Non esistono formule precise per la mediana di S_n, che tuttavia dev'essere compresa tra le parti intere inferiore e superiore di np, \lfloor np\rfloor e \lceil np\rceil. Se np è un intero allora la mediana è np. Se la funzione di ripartizione assume il valore 1/2 (ad esempio F(k)=1/2 per p=1/2 ed n=2k+1 dispari) allora tutti i valori dell'intervallo possono essere presi come mediana.

Altre distribuzioni di probabilità[modifica | modifica sorgente]

La distribuzione di Bernoulli \mathcal{B}(p) può essere considerata come un caso particolare di distribuzione binomiale \mathcal{B}(1,p), che descrive un processo di Bernoulli con una sola prova: S_1=X_1.

I successi in una sequenza di estrazioni da un'urna, effettuate senza reintroduzione degli estratti, sono descritti da una variabile aleatoria che segue la legge ipergeometrica.

Convergenze[modifica | modifica sorgente]

Per valori di n sufficientemente grandi la legge binomiale è approssimata da altre leggi.

Quando n tende a infinito, lasciando fisso \lambda=np, la distribuzione binomiale tende alla distribuzione di Poisson P(\lambda)=P(np). In statistica quest'approssimazione viene solitamente accettata quando n \ge 20 e p \le 1/20, oppure quando n \ge 100 e np \le 10.

Per il teorema del limite centrale, quando n tende a infinito, lasciando fisso p, la distribuzione binomiale tende alla distribuzione normale N(np,npq), di speranza np e varianza npq. In statistica quest'approssimazione viene solitamente accettata quando np>5 e nq>5.

Più precisamente, il teorema del limite centrale afferma che

\lim_{n\to\infty}\frac{S_n-E[S_n]}{\sqrt{\text{Var}(S_n)}}\ =\ \lim_{n\to\infty}\frac{S_n-np}{\sqrt{npq}}\ =\ \mathcal{N}(0,1)

Generalizzazioni[modifica | modifica sorgente]

Una generalizzazione della distribuzione binomiale \mathcal{B}(p,n) è la legge distribuzione Beta-binomiale \Beta(a,b,n), che descrive la somma S_n=X_1+X_2+...+X_n di n variabili aleatorie indipendenti, ognuna con distribuzione di Bernoulli \mathcal{B}(P), dove P segue la legge Beta \Beta(a,b). (Al contrario della distribuzione binomiale, le X_i non hanno lo stesso parametro.)

La distribuzione binomiale è una delle quattro distribuzioni di probabilità definite dalla ricorsione di Panjer: P(k)=(-\tfrac{p}{q}+\tfrac{1}{k}\tfrac{(n+1)p}{q})P(k-1).

Statistica[modifica | modifica sorgente]

Nell'inferenza bayesiana si utilizzano particolari relazioni tra la distribuzione binomiale e altre distribuzioni di probabilità.

Se P è una variabile aleatoria che segue la distribuzione Beta \Beta(a,b) e Sn è una variabile aleatoria con distribuzione binomiale \mathcal{B}(p,n), allora la probabilità condizionata da Sn=x per P segue la distribuzione Beta \Beta(a+x,b+n-x). In altri termini, la distribuzione Beta descrive P sia a priori che a posteriori di Sn=x.
In particolare la distribuzione continua uniforme sull'intervallo [0,1] è un caso particolare di distribuzione Beta \Beta(1,1), quindi la distribuzione per P, a posteriori di Sn=x, segue la legge Beta \Beta(x+1,n-x+1), che per inciso ha un massimo in x/n.

Note[modifica | modifica sorgente]

  1. ^ Ross, op. cit., p. 146

Bibliografia[modifica | modifica sorgente]

  • Sheldon M. Ross, Probabilità e statistica per l'ingegneria e le scienze, Trento, Apogeo, 2003, ISBN 88-7303-897-2.

Voci correlate[modifica | modifica sorgente]

Collegamenti esterni[modifica | modifica sorgente]

matematica Portale Matematica: accedi alle voci di Wikipedia che trattano di matematica