Distribuzione geometrica

Da Wikipedia, l'enciclopedia libera.
Distribuzione geometrica \mathcal{G}(q)
Funzione di distribuzione discreta
distribuzione di probabilità
Funzione di ripartizione
funzione di ripartizione
Parametri q \in ]0,1[p=1-q\
Supporto \mathbb{N}_0= \{0,1,2,...\}
Funzione di densità pq^{k}\
Funzione di ripartizione 1-q^{k+1}\
Valore atteso \frac{1}{p}
Mediana [\log_q\tfrac{1}{2}] se \log_q\tfrac{1}{2}\not\in\mathbb{N}
Moda 0\
Varianza \frac{q}{p^2}
Indice di asimmetria \frac{1+q}{\sqrt{q}}\
Curtosi 6+\frac{p^2}{q}
Entropia -\log p -\frac{q}{p}\log q
Funzione generatrice dei momenti \frac{p}{1-qe^t}
Funzione caratteristica \frac{pe^{it}}{1-qe^{it}}

In teoria della probabilità la distribuzione geometrica è una distribuzione di probabilità discreta sui numeri naturali (con l'elemento "0") che segue una progressione geometrica:

P(T=k)=p q^{k-1}\

È la probabilità che il primo successo (o evento in generale) richieda l' esecuzione di k prove indipendenti, ognuna di probabilità di successo p.  Se la probabilità di successo di ogni prova è p, allora la probabilità che alla kesima prova (dopo k prove) si ottenga il primo successo è

\Pr(X = k) = (1-p)^{k-1}\,p\,

con k = 1, 2, 3, ....

La formula qui sopra è usata per modellizzare il numero di tentativi fino ad ottenere il primo successo. Qui sotto invece si cerca il numero di fallimenti fino al primo successo:

\Pr(Y=k) = (1 - p)^k\,p\,

per k = 0, 1, 2, 3, ....


In entrambi i casi, la sequenza di probabilità è una serie geometrica.

Definizione[modifica | modifica sorgente]

La distribuzione geometrica \mathcal{G}(q) è la distribuzione di probabilità sui numeri naturali della forma

P(k)=pq^{k-1}, con q=1-p

dove q indica la probabilità di insuccesso. Il parametro q=1-p si ricava da

1=P(\mathbb{N}^+)=\sum_{k\geqslant0}p q^{k}=p \frac{1}{1-q}.

E ricordando la definizione di q si ottiene 1. Questo risultato è di fondamentale importanza: significa che per quanto sia piccola la probabilità che un evento accada, in un processo di Bernoulli questo prima o poi accadrà (questo si ricollega al Teorema della scimmia instancabile

A volte lo zero viene escluso dal supporto: se T ha distribuzione geometrica sopra descritta, la distribuzione di X =T+1 sarà P(k)=pq^{k-1} e le altre funzioni saranno modificate di conseguenza. Nell'esempio citato sopra, X sarebbe il numero di estrazioni da fare perché esca un numero fissato.

Processo di Bernoulli[modifica | modifica sorgente]

La distribuzione geometrica di parametro q descrive anche il numero T di fallimenti che precedono il primo successo in un processo di Bernoulli \{X_i\}_i di parametro p=1-q:

P(T=k)=P(X_1=0)\cdots P(X_k=0)P(X_{k+1}=1)=q^kp\

Caratteristiche[modifica | modifica sorgente]

Una variabile aleatoria T con distribuzione geometrica di parametro q e avente come supporto i numeri naturali incluso il numero 0 ha

P(T=k)= pq^{k-1}
P(T\leqslant k)=1-P(T\geqslant k+1)=1-q^{k}
E[T] = \sum_k kpq^{k-1} = \frac{1}{p}
\text{Var}(T)\ =\ E[T^2]-E[T]^2\ =\  \frac{q}{p^2}

I quantili si ricavano dalla funzione di ripartizione:

In particolare la mediana è

q_{1/2}\in[n-1,n] se q=\sqrt[n]{\tfrac{1}{2}} con n intero,
q_{1/2}=[\log_q\tfrac{1}{2}] altrimenti.

Assenza di memoria[modifica | modifica sorgente]

La distribuzione geometrica è priva di memoria, ovvero

P(T=m+n|T>m)=P(T=n)\

ed è l'unica distribuzione di probabilità discreta con questa proprietà.

L'indipendenza delle prove in un processo di Bernoulli implica l'assenza di memoria della distribuzione geometrica. D'altro canto, ogni variabile aleatoria T a supporto sui numeri naturali e priva di memoria rispetta

P(T=n)=P(T=n+1|T>1)=\frac{P(T=n+1)}{P(T>1)}

pertanto ha una distribuzione di probabilità geometrica di parametro P(T>1).

Generalizzazioni[modifica | modifica sorgente]

Una generalizzazione della distribuzione geometrica è la distribuzione di Pascal (o distribuzione binomiale negativa), che descrive il numero di fallimenti precedenti il successo r-esimo in un processo di Bernoulli.

Un'ulteriore generalizzazione della distribuzione di Pascal è la distribuzione di Panjer che, come la distribuzione geometrica, definisce le probabilità per ricorsione.

Esempi[modifica | modifica sorgente]

La probabilità che un dado (equilibrato, a 6 facce) debba venire lanciato esattamente 10 volte prima di fornire un "4" è data dalla distribuzione geometrica. Il lancio del dado può essere considerato un processo di Bernoulli, in cui ogni prova Xi ha probabilità p=1/6 di fornire "4" (successo) e q=5/6 di fornire un altro numero (fallimento). La probabilità cercata è quindi

\textstyle P(T=10)\ =\ \frac{1}{6}(\frac{5}{6})^9\ =\ 0,032...

La probabilità che dopo 10 lanci sia uscito almeno un "4" è invece

\textstyle P(T\leqslant 10)\ =\ 1-(\frac{5}{6})^{10}\ =\ 0,838...

La probabilità che al decimo lancio si ottenga un "4" dopo che per 9 lanci questo numero non è mai stato ottenuto è facilmente calcolabile grazie alla mancanza di memoria

\textstyle P(T=10|T>9)\ =\ P(T=1)\ =\ \frac{1}{6}\ =\ 0,166...

Voci correlate[modifica | modifica sorgente]

matematica Portale Matematica: accedi alle voci di Wikipedia che trattano di matematica