Teoremi centrali del limite

Da Wikipedia, l'enciclopedia libera.

I teoremi centrali del limite sono una famiglia di teoremi di convergenza debole nell'ambito della teoria della probabilità.

Una delle formulazioni più note del teorema è la seguente:

Sia  X_j variabili aleatorie indipendenti e identicamente distribuite, con  E[X_j] = \mu and  Var[X_j] = \sigma^2 \ \ \ \ \forall j , con  0 < \sigma^2 < \infty (Ovvero  X_j \in \mathcal{L}^2 ).

Sia  \displaystyle Y_n = \frac{\sum_{j=1}^n X_j - n \mu}{\sigma \sqrt{n}} .

Allora  Y_n converge in distribuzione a una normale standard;  Y_n \to^D Y \sim N(0,1)

Ciò spiega l'importanza che la funzione gaussiana assume nell'ambito della statistica e della teoria della probabilità in particolare. Fu dimostrato nel 1922 da Lindeberg nell'articolo "Eine neue Herleitung des Exponentialgesetzes in der Wahrscheinlichkeitsrechnung", e poi in modo indipendente da Turing.

Teorema di Lindeberg-Lévy[modifica | modifica wikitesto]

La più nota formulazione di un teorema centrale del limite è quella dovuta a Lindeberg e Lévy; si consideri una successione di variabili casuali \ \left\{x_{j}\right\}_{j=1}^{n} indipendenti e identicamente distribuite, Definendo come variabile casuale complessiva:

\ x^*=\frac{1}{\sqrt n}\sum_{j=1}^{n}\frac{x_{j}-\langle x \rangle_n}{\sigma_n} = \frac{1}{\sqrt n}\sum_{j=1}^{n} y_j

Bisogna semplicemente dimostrare che la variabile complessiva x^* converge in distribuzione alla gaussiana con valore atteso 0 e varianza 1, ovvero che:

\lim_{n\to\infty} x^* = \frac{e^{- \frac{\scriptscriptstyle 1}{\scriptscriptstyle 2} x^2}}{\sqrt{2\pi}}.

Sempre per semplicità di notazione sono state definite esplicitamente anche le variabili normalizzate come:

\ y_{j}=\frac{x_{j}-\langle x \rangle_n}{\sigma_n}

Si osservi che \ \textrm{E}[y_{j}]=0,\ \textrm{var}(y_{j})=\textrm{E}[y_{j}^{2}]=1\ \forall j.

Dimostrazione

La seguente dimostrazione [1] fa uso della nozione di funzione caratteristica della x^*, definibile in modo equivalente come una particolare funzione valore atteso o come la trasformata di Fourier della funzione di densità \ f_{x^*} (o di massa di probabilità per variabili casuali discrete) della variabile complessiva x^*:

\ \varphi_{x^*}(t)=\textrm{E}\left[e^{it x^*}\right]=\int_{\mathbb{R}}e^{it x^*}f(x^*)dx^*

dove \ i è l'unità immaginaria. Nel dominio di Fourier, l'enunciato del teorema:

\lim_{n\to\infty} x^* = \frac{e^{- \frac{\scriptscriptstyle 1}{\scriptscriptstyle 2} x^2}}{\sqrt{2\pi}}.

diventa equivalente a:

\ \lim_{n\rightarrow\infty}\varphi_{x^*}(t)=e^{-\frac{t^{2}}{2}} \qquad \forall f(x^*)

infatti il secondo membro è la funzione caratteristica della distribuzione normale.

Nel caso presente, si ha:

\varphi_{x^*}(t)= \textrm{E}\left[\exp\left\{it x^* \right\} \right]=\textrm{E}\left[ \exp\left\{\frac{it}{\sqrt n}\sum_{j=1}^{n} y_j \right\}\right]=\prod_{j=1}^{n} \textrm{E}\left[\exp\left\{\frac{it}{\sqrt{n}}y_{j}\right\}\right]

dove l'ultima uguaglianza discende dalla indipendenza degli \ x_j quindi anche degli \ y_j. Effettuando lo sviluppo di Maclaurin dell'esponenziale, si può calcolarne il valore atteso:

\ \textrm{E}\left[\exp\left\{\frac{it}{\sqrt{n}}y_{j}\right\}\right]=\textrm{E}\left[1+\frac{i}{\sqrt{n}} ty_{j}-\frac{1}{n}\frac{t^{2}}{2}y_{j}^{2}+o\left(t^2 y_{j}^{2}\right)\right]=1-\frac{1}{n}\left(\frac{t^{2}}{2}\right) \forall\ j [1]

Segue che:

\varphi_{x^*}(t)=\prod_{j=1}^{n} \left(1-\frac{1}{n}\left(\frac{t^{2}}{2}\right) \right) =\left(1-\frac{1}{n}\left(\frac{t^{2}}{2}\right)\right)^{n}

Ma applicando il limite notevole: \ \lim_{n\rightarrow\infty}\left(1-\frac{x}{n}\right)^{n}=e^{-x} , si ha:

\ \lim_{n\rightarrow\infty}\varphi_{x^*}(t)=e^{-\frac{t^{2}}{2}}
come volevasi dimostrare.

Teorema di De Moivre-Laplace[modifica | modifica wikitesto]

Si tratta di un'applicazione del teorema di Lindeberg-Levi al caso di distribuzione binomiale:

Se Y=Bi(n,p) è una variabile casuale binomiale, che possiamo vedere come somma di n variabili casuali bernoulliane. Allora per n\to\infty:

Y=N(np,np(1-p)),

ovvero una gaussiana con media np e varianza np(1-p).

Se standardizziamo:

\lim_{n\to\infty} \frac{Y_n-np}{\sqrt{np(1-p)}}=Z.

Questo teorema è molto utile nel caso si vogliano valori approssimati del numero di successi nella ripetizione di un esperimento indipendente dagli esiti passati, visto che la variabile aleatoria binomiale risulta spesso difficile da calcolare con numeri elevati. L'approssimazione è tanto migliore quanto più è alto il numero di esperimenti.

Dimostrazione

Il teorema di De Moivre-Laplace può essere dimostrato più facilmente del teorema Centrale del Limite, con una prova per la quale è necessaria la conoscenza degli sviluppi di Taylor e dell'Approssimazione di Stirling. Per il fattoriale di un numero n sufficientemente grande vale la formula di Stirling, secondo cui:

n! \simeq \sqrt{2 \pi n} \left(\frac{n}{e}\right)^n

o, equivalentemente:

n! \simeq n^n e^{-n}\sqrt{2 \pi n}

La funzione di densità di  Bi(n,p) si potrà scrivere allora come:


\begin{align}
{n \choose k}\, p^k q^{n-k} & = \frac{n!}{k!\left(n-k\right)!} p^k q^{n-k} \\
& \simeq \frac{n^ne^{-n}\sqrt{2\pi n} }{k^ke^{-k}\sqrt{2\pi k} {(n-k)}^{n-k}e^{-(n-k)}\sqrt{2\pi (n-k)} }p^k q^{n-k}\\
& =\left[\frac{\sqrt{2\pi n} }{\sqrt{2\pi k} \sqrt{2\pi (n-k)} }\right]\left[\frac{n^n }{k^k {(n-k)}^{n-k} }\right]\left[\frac{e^{-n}}{e^{-k}e^{-(n-k)} }\right]p^k q^{n-k}\\
& =\left[\frac{\sqrt{n} }{\sqrt{k} \sqrt{2\pi (n-k)} }\right]\left[\frac{n^n }{k^k {(n-k)}^{n-k} }\right]\left[\frac{e^{-n}}{e^{-k} e^{-n}{ e}^k }\right]p^ kq^{n-k}\\
& =\left[\sqrt{\frac{n}{2\pi k(n-k)}}\right]\left[n^n{\left(\frac{p }{k }\right)}^k{\left(\frac{q }{n-k }\right)}^{(n- k)}\right] e^{-n+k+n-k}\\
& =\left[\sqrt{\frac{n}{2\pi k(n-k)}}\right]\left[n^{n-k+k}{\left(\frac{p }{k }\right)}^k{\left(\frac{q }{n-k }\right)}^{(n- k)}\right]\\
& =\left[\sqrt{\frac{n}{2\pi k(n-k)}}\right] \left[ n^{n-k} n^k {\left(\frac{p}{k}\right)}^k {\left(\frac{q}{n-k}\right)}^{(n-k)}\right]\\
& =\left[\sqrt{\frac{n}{2\pi k(n-k)}}\right]\left[{\left(\frac{np }{k }\right)}^k{\left(\frac{nq }{n-k }\right)}^{(n- k)} \right]\\
& =\left[\sqrt{\frac{n}{2\pi k(n-k)}}\right]\left[{\left(\frac{k }{np }\right)}^{-k}{\left(\frac{n-k}{nq }\right)}^{-(n- k)}\right]\\
\end{align}

Sia ora

x=\frac{(k-np)}{\sqrt{npq}}
\Rightarrow \ k=np+x\sqrt{npq }  and  n-k=nq- x\sqrt{npq }
\Rightarrow \ \frac{k}{np}=1+x\sqrt{\frac{q}{np}}  and  \frac{n-k}{nq}=1-x\sqrt{\frac{p}{nq}}
\Rightarrow\ {n \choose k}p^kq^{n-k}\simeq \left[\sqrt{\frac{n}{2{\mathbf \pi }k(n-k)}}\right]\left[{\left(1+x\sqrt{\frac{q}{np}}\right)}^{-k}{\left(1-x\sqrt{\frac{p}{nq}}\right)}^{-(n - k)}\right]

Consideriamo dapprima il primo termine tra parentesi quadre nell'ultima uguaglianza:


\begin{align}
\sqrt{\frac{n}{2\pi k\left(n-k\right)}} & =\sqrt{\frac{n}{2\pi k\left(n-k\right)}\times \frac{{1}/{n^2}}{{1}/{n^2}}} \\
& =\sqrt{\frac{{1}/{n}}{{2\pi k(n-k)}/{n^2}}} \\
& =\sqrt{\frac{{1}/{n}}{2\pi \frac{k}{n}\frac{(n-k)}{n}}}\\
& =\sqrt{\frac{{1}/{n}}{2\pi \frac{k}{n}\left(1-\frac{k}{n}\right)}} \\
& =\sqrt{\frac{{1}/{n}}{2\pi p\left(1-p\right)}} \qquad \qquad \qquad \left[\because k\to np\Rightarrow \frac{k}{n}\to p\right] \\
& =\sqrt{\frac{{1}/{n}}{2\pi pq}} \qquad \qquad \qquad \left[\because p+q=1\Rightarrow q=1-p\right]\\
& =\sqrt{\frac{1}{2\pi npq}}\\
& =\frac{1}{\sqrt{2\pi npq}}\\
\end{align}
\Rightarrow{n \choose k}p^kq^{n-k}\simeq \frac{1}{\sqrt{2{\mathbf \pi }npq}}\left[{\left(1+x\sqrt{\frac{q}{np}}\right)}^{-k}{\left(1-x\sqrt{\frac{p}{nq}}\right)}^{-(n - k)}\right]

E quindi il secondo termine tra parentesi quadrate:

\left[{\left(1+x\sqrt{\frac{q}{np}}\right)}^{-k}{\left(1-x\sqrt{\frac{p}{nq}}\right)}^{-\left(n - k\right)}\right]=e^{\ln \left[{\left(1+x\sqrt{\frac{q}{np}}\right)}^{-k}{\left(1-x\sqrt{\frac{p}{nq}}\right)}^{-\left(n - k\right)}\right]}

Per cui si ha che:

{n \choose k}p^kq^{n-k}\simeq \frac{1}{\sqrt{2{\mathbf \pi }npq}}e^{\ln \left[{\left(1+x\sqrt{\frac{q}{np}}\right)}^{-k}{\left(1-x\sqrt{\frac{p}{nq}}\right)}^{-\left(n - k\right)}\right]}

Consideriamo quindi il logarimo naturale che appare nell'ultima uguaglianza.


\begin{align}
\ln\left[{\left(1+x\sqrt{\frac{q}{np}}\right)}^{-k}{\left(1-x\sqrt{\frac{p}{nq}}\right)}^{-\left(n-k\right)}\right] & =\ln{\left(1+x\sqrt{\frac{q}{np}}\right)}^{-k}+\ln{\left(1-x\sqrt{\frac{p}{nq}}\right)}^{-\left(n-k\right)}\\
& =-k\ln\left(1+x\sqrt{\frac{q}{np}}\right)-\left(n-k\right)\ln\left(1-x\sqrt{\frac{p}{nq}}\right)\\
\end{align}

Utilizzando le espansioni di Taylor seguenti:-

\ln\left(1+y\right)=y-\frac{y^2}{2}+\frac{y^3}{3}-\frac{y^4}{4}+\cdots
\ln\left(1-y\right)=-y-\frac{y^2}{2}-\frac{y^3}{3}-\frac{y^4}{4}-\cdots

si ha:

\ln\left(1+x\sqrt{\frac{q}{np}}\right)=x\sqrt{\frac{q}{np}}-\frac{x^2q}{2np}+\cdots

e

\ln\left(1-x\sqrt{\frac{p}{nq}}\right)=-x\sqrt{\frac{p}{nq}}-\frac{x^2p}{2nq}-\cdots

\begin{align}
\Rightarrow{\ln \left[{\left(1+x\sqrt{\frac{q}{np}}\right)}^{-k}{\left(1-x\sqrt{\frac{p}{nq}}\right)}^{-\left(n-k\right)}\right]}& =-k\left(x\sqrt{\frac{q}{np}}-\frac{x^2q}{2np}+\cdots \right)-\left(n-k\right)\left(-x\sqrt{\frac{p}{nq}}-\frac{x^2p}{2nq}-\cdots \right)\\
& =-\left(np+x\sqrt{npq}\right)\left(x\sqrt{\frac{q}{np}}-\frac{x^2q}{2np}+\cdots \right)\\
& -\left(nq-x\sqrt{npq}\right)\left(-x\sqrt{\frac{p}{nq}}-\frac{x^2p}{2nq}-\cdots \right)\\
\end{align}

per cui


\begin{align}
\Rightarrow {\ln \left[{\left(1+x\sqrt{\frac{q}{np}}\right)}^{-k}{\left(1-x\sqrt{\frac{p}{nq}}\right)}^{-\left(n-k\right)}\right]}& =-\left(np\times x\sqrt{\frac{q}{np}}-np\times \frac{x^2q}{2np}+x\sqrt{npq}\times x\sqrt{\frac{q}{np}}-x\sqrt{npq}\times \frac{x^2q}{2np}+\cdots \right)\\
& -\left(-nq\times x\sqrt{\frac{p}{nq}}-nq\times \frac{x^2p}{2nq}+x\sqrt{npq}\times x\sqrt{\frac{p}{nq}}+x\sqrt{npq}\times \frac{x^2p}{2nq}+\cdots \right)\\
& =-\left(x\sqrt{npq}-\frac{x^2q}{2}+x^2q+\cdots \right)-\left(-x\sqrt{npq}-\frac{x^2p}{2}+x^2p+\cdots \right)\\
& =-\left(x\sqrt{npq}+\frac{x^2q}{2}+\cdots \right)-\left(-x\sqrt{npq}+\frac{x^2p}{2}+\cdots \right)\\
& =-x\sqrt{npq}-\frac{x^2q}{2}+x\sqrt{npq}-\frac{x^2p}{2}-\cdots \\
& =-\frac{x^2q}{2}-\frac{x^2p}{2}-\cdots \\
& =-\frac{x^2}{2}\left(q+p\right)-\cdots \\
& =-\frac{x^2}{2}-\cdots \\
\end{align}
\Rightarrow {\ln \left[{\left(1+x\sqrt{\frac{q}{np}}\right)}^{-k}{\left(1-x\sqrt{\frac{p}{nq}}\right)}^{-\left(n-k\right)}\right]} \simeq -\frac{x^2}{2}
\Rightarrow {n \choose k}p^kq^{n-k}\simeq \frac{1}{\sqrt{2{\mathbf \pi }npq}}e^{\ln\left[{\left(1+x\sqrt{\frac{q}{np}}\right)}^{-k}{\left(1-x\sqrt{\frac{p}{nq}}\right)}^{-\left(n-k\right)}\right]}\simeq \frac{1}{\sqrt{2{\mathbf \pi }npq}}e^{{-x^2}/{2}}

Possiamo ignorare i termini di grado maggiore del secondo, essendo  x proporzionale a  (k-np) che tende a 0 al crescere di  n .

Dunque, elevando al quadrato e dividendo per due x, si ha:

 \frac{x^2}{2}=\frac{{\left(\frac{(k-np)}{\sqrt{npq}}\right)}^2}{2}=\frac{{\left(k-np\right)}^2}{2npq}

Quindi,

{n \choose k}p^k(1-p)^{n-k}\simeq \frac{1}{\sqrt{2{\mathbf \pi }np(1-p)}}e^{{-{\left(k-np\right)}^2}/{2np(1-p)}}
che è esattamente l'asserto che volevamo provare - il termine a destra è una distribuzione gaussiana con media  np e varianza  np(1-p) .

Note[modifica | modifica wikitesto]

  1. ^ a b Flandoli, p. 1,2

Bibliografia[modifica | modifica wikitesto]

Voci correlate[modifica | modifica wikitesto]

Altri progetti[modifica | modifica wikitesto]

matematica Portale Matematica: accedi alle voci di Wikipedia che trattano di matematica