Distribuzione di Pascal

Da Wikipedia, l'enciclopedia libera.
Distribuzione di Pascal, o binomiale negativa \mathcal{NB}(p,n)
Funzione di distribuzione discreta
Distribuzione di probabilità
Funzione di ripartizione
Parametri p \in [0,1]\
p=1-q
n\in\mathbb{N} oppure r\in\mathbb{R}
Supporto \mathbb{N}
Funzione di densità {k+n-1\choose k}p^nq^k\ =\ {-n\choose k}p^n(-q)^k
Funzione di ripartizione I_p(n,k+1)\
funzione Beta incompleta regolarizzata
Valore atteso n\frac{1}{p}
Mediana
Moda
Varianza n\frac{q}{p^2}
Indice di asimmetria \frac{1+q}{\sqrt{nq}}
Curtosi \frac{6}{n}+\frac{p^2}{nq}
Entropia
Funzione generatrice dei momenti \left(\frac{p}{1-qe^t}\right)^n
Funzione caratteristica \left(\frac{p}{1-qe^{it}}\right)^n

In teoria delle probabilità la distribuzione di Pascal è una distribuzione di probabilità discreta con due parametri, p ed n, che descrive il numero di fallimenti precedenti il successo n-esimo in un processo di Bernoulli di parametro p.

A volte si considera la distribuzione di Pascal come quella distribuzione che descrive il numero di prove necessarie per ottenere n successi. Questa distribuzione è equivalente alla precedente ma riscalata, ovvero descrive una variabile aleatoria T_n+n anziché T_n.

Ad esempio, lanciando una moneta fino ad ottenere 3 volte testa, la distribuzione di Pascal descrive le probabilità per il numero di risultati croce visti nel frattempo.

La distribuzione prende il nome dal matematico francese Blaise Pascal.

Questa distribuzione di probabilità può essere generalizzata sostituendo il numero naturale n con un numero reale positivo r. In questo caso viene detta anche distribuzione binomiale negativa (per la sua particolare formula) o di Polya (dal matematico ungherese George Polya).

Definizione[modifica | modifica wikitesto]

Dato un processo di Bernoulli, ovvero una serie di variabili aleatorie indipendenti X_1,X_2,... di uguale distribuzione di Bernoulli \mathcal{B}(p), la distribuzione di Pascal \mathcal{NB}(p,n)descrive la variable aleatoria T_n che conta il numero di fallimenti precedenti il successo numero n (ovvero il numero di prove necessarie ad ottenerlo, meno n):

T_n=\min\{t\colon X_1+...+X_{t+n}=n\},
T_n+n=\min\{t\colon X_1+...+X_t=n\}.

La probabilità di fallimento di una singola prova è q=1-p. La probabilità che si verifichino esattamente k fallimenti prima di ottenere un totale di n successi è data dalla probabilità di ottenere un successo nella prova numero k+n (X_{k+n}=1) e di ottenere esattamente k fallimenti e n-1 successi nelle prove precedenti, ovvero

P(k)={k+n-1\choose k}p^nq^k,

dove il coefficiente binomiale conta il numero di possibili disposizioni di successi e fallimenti. Questa probabilità può anche essere scritta nella forma binomiale negativa

P(k)={-n \choose k}p^n(-q)^k,

dove si considera la generalizzazione del coefficiente binomiale

{-n\choose k}=\frac{(-n)(-n-1)\cdots(-n-k+1)}{k!}=(-1)^k{n+k-1\choose k}.

Definizioni alternative[modifica | modifica wikitesto]

Sostituendo il numero naturale n con il numero reale positivo r la formula mantiene un significato, anche se il coefficiente binomiale può essere espresso tramite la funzione Gamma, che estende il concetto di fattoriale (\Gamma(n+1)=n!):

{k+r-1\choose k}p^rq^k=\frac{r(r+1)\cdots(k+r-1)}{k!}p^rq^k=\frac{\Gamma(k+r)}{k!\Gamma(r)}p^rq^k.

Alcuni testi definiscono la distribuzione di Pascal come quella che descrive il numero di prove fino al successo n-esimo, ed altri scambiano i termini successo ed insuccesso nella definizione. Per collegare queste definizioni basta rispettivamente considerare la variabile aleatoria T_n+n al posto di T_n nel primo caso e scambiare i valori di p e q nell'altro.

Distribuzione geometrica[modifica | modifica wikitesto]

Una variabile aleatoria T_n con distribuzione di Pascal \mathcal{NB}(p,n) è pari alla somma Y_1+...+Y_n di n variabili aleatorie indipendenti con uguale distribuzione geometrica \mathcal{G}(q). Questo si può vedere considerando come Y_i la variabile aleatoria che conta il numero di fallimenti intercorsi tra il successo numero i-1 e il successo numero i: le Y_1,...,Y_n sono allora indipendenti ed hanno distribuzione geometrica di parametro q.

In particolare, la distribuzione di Pascal \mathcal{NB}(p,1) coincide con la distribuzione geometrica \mathcal{G}(q), e la somma di m variabili aleatorie indipendenti con distribuzioni di Pascal aventi lo stesso parametro p segue ancora la distribuzione di Pascal con parametro p (è sempre somma di variabili aleatorie indipendenti con uguale distribuzione geometrica).

Caratteristiche[modifica | modifica wikitesto]

Alcune caratteristiche di una variabile aleatoria Tn che segue la distribuzione di Pascal \mathcal{NB}(p,n) si possono ricavare dalle caratteristiche di una variabile aleatoria T con distribuzione geometrica \mathcal{G}(q):

E[T_n]=nE[T]=n\frac{q}{p},

\text{Var}(T_n)=n\text{Var}(T)=n\frac{q}{p^2},
g_{T_n}(t)=g_{T}(t)^n=\left({\frac{p}{1-qe^t}}\right)^n,
\gamma_1=\frac{1}{\sqrt{n}}\frac{1+q}{\sqrt{q}},\qquad\gamma_2=\frac{1}{n}\left(6+\frac{p^2}{q}\right).

La funzione di ripartizione può essere definita tramite la funzione Beta incompleta regolarizzata:

P(T_n\leqslant k)=I_p(n,k+1)

Tutte le formule valgono ancora anche sostituendo il numero naturale n con il numero reale positivo r.

Altre distribuzioni[modifica | modifica wikitesto]

La distribuzione di Pascal è una mistura della distribuzione Gamma e della distribuzione di Poisson: una variabile aleatoria con distribuzione di Poisson \mathcal{P}(L), il cui parametro L segua una distribuzione Gamma, segue la distribuzione di Pascal.

La distribuzione di Pascal \mathcal{NB}(\frac{r}{\lambda+r},r), di speranza \lambda, converge alla distribuzione di Poisson \mathcal{P}(\lambda).

La distribuzione di Pascal si trova anche come mistura della distribuzione di Poisson e della distribuzione logaritmica, ovvero descrive la somma X_1+...+X_N di un numero N, che segue la distribuzione di Poisson, di variabili aleatorie indipendenti che seguono una stessa distribuzione logaritmica.

Considerando le variabili aleatorie S_n=X_1+...+X_n di distribuzione binomiale \mathcal{B}(p,n) e le variabili aleatorie T_n=\min\{k\colon X_1+...+X_{k+n}=n\}=\min\{k\colon S_{k+n}=n\} di distribuzione di Pascal \mathcal{NB}(p,n) si trova la formula

P(T_n\leqslant k)=P(T_n+n\leqslant n+k)=P(S_{n+k}\geqslant n),

che esprime per un processo di Bernoulli l'equivalenza degli eventi "ottenere meno di k insuccessi prima del successo n-esimo" e "ottenere almeno n successi nelle prime n+k prove".

La distribuzione di Panjer, che definisce i valori per ricorsione, generalizza la distribuzione di Pascal:

P(k)=(q+\frac{q(n-1)}{k})P(k-1)

Statistica[modifica | modifica wikitesto]

La distribuzione di Pascal viene talvolta utilizzata in alternativa alla distribuzione di Poisson, a cui converge in legge sotto la condizione \lambda=r\tfrac{q}{p}, nei casi in cui il modello empirico presenti una varianza maggiore del valore medio: la distribuzione di Poisson ha sempre speranza pari al valore medio, mentre la distribuzione di Pascal è più dispersa (ha una varianza maggiore).

Come spesso avviene nell'inferenza bayesiana, se il parametro p di una distribuzione di Pascal segue a priori la distribuzione Beta, allora la segue anche a posteriori.

Voci correlate[modifica | modifica wikitesto]

matematica Portale Matematica: accedi alle voci di Wikipedia che trattano di matematica