Legge dei grandi numeri

Da Wikipedia, l'enciclopedia libera.

La legge dei grandi numeri, detta anche legge empirica del caso oppure teorema di Bernoulli (in quanto la sua prima formulazione è dovuta a Jakob Bernoulli), descrive il comportamento della media di una sequenza di n variabili casuali indipendenti e caratterizzate dalla stessa distribuzione di probabilità (n misure della stessa grandezza, n lanci della stessa moneta ecc.) al tendere ad infinito della numerosità della sequenza stessa (n). In altre parole, grazie alla legge dei grandi numeri, possiamo fidarci che la media che calcoliamo a partire da un numero sufficiente di campioni sia sufficientemente vicina alla media vera.

In termini generici, per la legge dei grandi numeri si può dire:

  • che la media della sequenza è un'approssimazione, che migliora al crescere di n, della media della distribuzione;
  • e che, viceversa, si può prevedere che sequenze siffatte mostreranno una media tanto più spesso e tanto più precisamente prossima alla media della distribuzione quanto più grande sarà n.

Un caso particolare di applicazione della legge dei grandi numeri è la previsione probabilistica della proporzione di successi in una sequenza di n realizzazioni indipendenti di un evento E: per n che tende a infinito, la proporzione di successi converge alla probabilità di E (vedi esempio).

Legge forte dei grandi numeri[modifica | modifica sorgente]

Se, data una successione di variabili casuali X_1, X_2, ..., X_n, ... indipendenti e identicamente distribuite con media {\mu}, si considera la media calcolata

\bar{X}_n = \frac{X_1 + X_2 + \cdots + X_n}{n}

la legge (forte) dei grandi numeri afferma che

\operatorname{P}\left(\lim_{n\rightarrow\infty}\bar{X}_n=\mu\right)=1,

ossia la media campionaria converge quasi certamente alla media comune delle X_i.

Legge debole dei grandi numeri[modifica | modifica sorgente]

Se, data una successione di variabili casuali X_1, X_2, ..., X_n, ... aventi la stessa media {\mu}, la stessa varianza finita e indipendenti, si considera la media campionaria

\bar{X}_n = \frac{X_1 + X_2 + \cdots + X_n}{n}

la legge (debole) dei grandi numeri afferma che per ogni \ \varepsilon>0:

\lim_{n\rightarrow\infty}\operatorname{P}\left(\left|\bar{X}_n-\mu\right|<\varepsilon\right)=1.

ossia la media campionaria converge in probabilità alla media comune delle X_i.

Esempio[modifica | modifica sorgente]

Supponiamo di avere un evento (come il fatto che lanciando un dado esca il sei) con probabilità sconosciuta p (sconosciuta perché il dado potrebbe essere truccato, o semplicemente difettoso: non possiamo saperlo in anticipo).

Eseguendo n lanci consecutivi otteniamo una stima della probabilità di fare sei con quel dado, data da

\bar{X}_n = \frac{X_1 + X_2 + ... + X_n}{n}

dove le X della somma rappresentano l'esito dei lanci e valgono uno se in quel lancio è uscito il sei, o zero se è uscito un altro numero. La legge dei grandi numeri afferma semplicemente che, tante più prove usiamo per calcolare la stima, tanto più questa sarà vicina, probabilmente, alla probabilità reale dell'evento p.

Se la stima X(n) che calcoleremo sarà molto vicina a un sesto, che è la probabilità teorica che esca il sei per un dado perfetto, potremo essere ragionevolmente certi che il dado in questione non è polarizzato per il sei (per essere sicuri che il dado non sia truccato in nessun modo dovremmo ripetere il test anche per gli altri cinque numeri). Che cosa significhi ragionevolmente sicuri dipende da quanto vogliamo essere precisi nel nostro test: con dieci prove avremmo una stima grossolana, con cento ne otterremmo una molto più precisa, con mille ancora di più e così via: il valore di n che siamo disposti ad accettare come sufficiente dipende dal grado di casualità che riteniamo necessario per il dado in questione.

Con maggior rigore[modifica | modifica sorgente]

Sia \{(\Omega_i, \mathcal{A}_i, \operatorname{P}_i)\}_{i\in\mathbb{N}} una successione di spazi di probabilità. Si consideri lo spazio prodotto (\Omega, \mathcal{A}, \operatorname{P}) e in esso una successione bernoulliana di eventi (stocasticamente indipendenti e con probabilità costante p) \{E_k\}_{k\in\mathbb{N}}\subseteq\mathcal{A}. Assegnato un elemento \omega\in\Omega si definisce la frequenza di successo in n prove\phi_n:\Omega\to\mathbb{R}, \omega\mapsto\frac{N_n}{n}, dove N_n=\#\{i:\omega\in E_i\}^n_{i=1} indica il numero di successi ottenuti in n prove.

Voci correlate[modifica | modifica sorgente]

Collegamenti esterni[modifica | modifica sorgente]

matematica Portale Matematica: accedi alle voci di Wikipedia che trattano di matematica