Riga 10:
Riga 10:
== Teorema di Lindeberg-Lévy ==
== Teorema di Lindeberg-Lévy ==
La più nota formulazione di un teorema centrale del limite è quella dovuta a Lindeberg e [[Paul Lévy|Lévy]]; si consideri una successione di [[variabile casuale|variabili casuali]] <math>\ \left\{x_{j}\right\}_{j=1}^{n}</math> indipendenti e identicamente distribuite, e in particolare tali che esistano, finiti, i loro [[momento (statistica)|momenti]] di ordine primo e secondo, e sia in particolare <math>\ \textrm{E}[x_{j}]=\mu<\infty</math> e <math>\ \textrm{var}(x_{j})=\sigma^{2}<\infty</math> per ogni <math>\ j</math>. Definita allora la nuova variabile casuale:
La più nota formulazione di un teorema centrale del limite è quella dovuta a Lindeberg e [[Paul Lévy|Lévy]]; si consideri una successione di [[variabile casuale|variabili casuali]] <math>\ \left\{x_{j}\right\}_{j=1}^{n}</math> indipendenti e identicamente distribuite, e in particolare tali che siano finiti i loro [[momento (statistica)|momenti]] primo e secondo, e quindi anche la loro [[media ]] μ e la loro [[deviazione standard]] σ .
Definita allora la nuova variabile casuale:
::<math>\ S_{n}=\frac{\bar{x}-\mu}{\sigma}\sqrt{n}</math>
::<math>\ S_{n}=\frac{\bar{x}-\mu}{\sigma}\sqrt{n}</math>
I teoremi centrali del limite sono una famiglia di teoremi di convergenza debole nell'ambito della teoria della probabilità .
A tutti i teoremi è comune l'affermazione che una popolazione di variabili casuali indipendenti e identicamente distribuite tende al limite alla distribuzione gaussiana con la media μ e la deviazione σ della popolazione.[1]
Ciò spiega l'importanza che la funzione gaussiana assume nell'ambito della statistica e della teoria della probabilità in particolare.
Matematicamente si esprime:
lim
n
→
∞
∑
i
=
1
n
X
i
n
−
μ
σ
n
=
N
(
0
,
1
)
.
{\displaystyle \lim _{n\to \infty }{\frac {{\frac {\sum _{i=1}^{n}X_{i}}{n}}-\mu }{\sigma }}{\sqrt {n}}=N(0,1).}
Lindeberg dimostrò nel 1922 il teorema centrale del limite nell'articolo "Eine neue Herleitung des Exponentialgesetzes in der Wahrscheinlichkeitsrechnung" , dimostrato successivamente e autonomamente da Turing .
Teorema di Lindeberg-Lévy
La più nota formulazione di un teorema centrale del limite è quella dovuta a Lindeberg e Lévy ; si consideri una successione di variabili casuali
{
x
j
}
j
=
1
n
{\displaystyle \ \left\{x_{j}\right\}_{j=1}^{n}}
indipendenti e identicamente distribuite, e in particolare tali che siano finiti i loro momenti primo e secondo, e quindi anche la loro media μ e la loro deviazione standard σ.
Definita allora la nuova variabile casuale:
S
n
=
x
¯
−
μ
σ
n
{\displaystyle \ S_{n}={\frac {{\bar {x}}-\mu }{\sigma }}{\sqrt {n}}}
dove
x
¯
=
∑
j
=
1
n
x
j
n
{\displaystyle \ {\bar {x}}={\frac {\sum _{j=1}^{n}x_{j}}{n}}}
è la media aritmetica degli
x
j
{\displaystyle \ x_{j}}
,
si ha che
S
n
{\displaystyle \ S_{n}}
converge in distribuzione a una distribuzione gaussiana avente valore atteso 0 e varianza 1, ossia la distribuzione di
S
n
{\displaystyle \ S_{n}}
, al limite per
n
{\displaystyle \ n}
che tende a infinito, coincide con quella di una distribuzione gaussiana.
Dimostrazione
La dimostrazione del teorema fa uso della nozione di funzione caratteristica della
S
n
{\displaystyle \ S_{n}}
, che altro non è che la trasformata di Fourier della funzione di densità (o di massa di probabilità per variabili casuali discrete) della
S
n
{\displaystyle \ S_{n}}
:
φ
S
n
(
t
)
=
E
[
exp
{
i
t
S
n
}
]
=
∫
R
e
i
t
S
n
f
S
n
(
x
)
d
x
{\displaystyle \ \varphi _{S_{n}}(t)={\textrm {E}}\left[\exp \left\{itS_{n}\right\}\right]=\int _{\mathbb {R} }e^{itS_{n}}f_{S_{n}}(x)dx}
dove
i
{\displaystyle \ i}
è l'unità immaginaria , e
f
S
n
{\displaystyle \ f_{S_{n}}}
denota la funzione di densità di probabilità di
S
n
{\displaystyle \ S_{n}}
. Nel caso presente, si ha:
E
[
exp
{
i
t
S
n
}
]
=
E
[
exp
{
i
t
n
∑
j
=
1
n
x
j
−
μ
σ
/
n
}
]
=
∏
j
=
1
n
E
[
exp
{
i
t
n
x
j
−
μ
σ
}
]
{\displaystyle \ {\textrm {E}}\left[\exp \left\{itS_{n}\right\}\right]={\textrm {E}}\left[\exp \left\{{\frac {it}{n}}\sum _{j=1}^{n}{\frac {x_{j}-\mu }{\sigma /{\sqrt {n}}}}\right\}\right]=\prod _{j=1}^{n}{\textrm {E}}\left[\exp \left\{{\frac {it}{\sqrt {n}}}{\frac {x_{j}-\mu }{\sigma }}\right\}\right]}
dove l'ultima uguaglianza discende dalla indipendenza degli
x
j
{\displaystyle \ x_{j}}
; per semplicità di notazione sia
y
j
=
x
j
−
μ
σ
{\displaystyle \ y_{j}={\frac {x_{j}-\mu }{\sigma }}}
; si osservi che
E
[
y
j
]
=
0
,
var
(
y
j
)
=
E
[
y
j
2
]
=
1
∀
j
{\displaystyle \ {\textrm {E}}[y_{j}]=0,\ {\textrm {var}}(y_{j})={\textrm {E}}[y_{j}^{2}]=1\ \forall j}
. Si consideri quindi lo sviluppo di Taylor , centrato in
y
j
=
0
{\displaystyle \ y_{j}=0}
del valore atteso :
E
[
exp
{
i
t
n
y
j
}
]
=
E
[
1
+
i
t
n
y
j
−
1
2
t
2
n
y
j
2
+
o
(
y
j
2
)
]
=
1
−
1
n
(
t
2
2
)
∀
j
{\displaystyle \ {\textrm {E}}\left[\exp \left\{{\frac {it}{\sqrt {n}}}y_{j}\right\}\right]={\textrm {E}}\left[1+{\frac {it}{\sqrt {n}}}y_{j}-{\frac {1}{2}}{\frac {t^{2}}{n}}y_{j}^{2}+o\left(y_{j}^{2}\right)\right]=1-{\frac {1}{n}}\left({\frac {t^{2}}{2}}\right)\ \forall \ j}
Segue che:
E
[
exp
{
i
t
S
n
}
]
=
(
1
−
1
n
(
t
2
2
)
)
n
{\displaystyle \ {\textrm {E}}\left[\exp \left\{itS_{n}\right\}\right]=\left(1-{\frac {1}{n}}\left({\frac {t^{2}}{2}}\right)\right)^{n}}
Ma applicando il limite notevole:
lim
n
→
∞
(
1
+
x
n
)
n
=
e
x
{\displaystyle \ \lim _{n\rightarrow \infty }\left(1+{\frac {x}{n}}\right)^{n}=e^{x}}
, si ha:
lim
n
→
∞
φ
S
n
(
t
)
=
lim
n
→
∞
(
1
+
1
n
(
−
t
2
2
)
)
n
=
exp
{
−
t
2
2
}
{\displaystyle \ \lim _{n\rightarrow \infty }\varphi _{S_{n}}(t)=\lim _{n\rightarrow \infty }\left(1+{\frac {1}{n}}\left(-{\frac {t^{2}}{2}}\right)\right)^{n}=\exp \left\{-{\frac {t^{2}}{2}}\right\}}
Nell'espressione sopra si riconosce la
funzione caratteristica di una distribuzione gaussiana, così che la
funzione di densità , e dunque la
funzione di ripartizione , della
S
n
{\displaystyle \ S_{n}}
, converge a quella di una distribuzione gaussiana al tendere di
n
{\displaystyle \ n}
a infinito,
come volevasi dimostrare .
Teorema di De Moivre-Laplace
Un corollario importante e usato frequentemente del teorema Centrale del Limite è il seguente:
Se
Y
=
B
i
(
n
,
p
)
{\displaystyle Y=Bi(n,p)}
è una v.c. binomiale, che possiamo vedere come somma di
n
{\displaystyle n}
v.c. bernoulliane. Allora per
n
→
∞
{\displaystyle n\to \infty }
:
Y
=
N
(
n
p
,
n
p
(
1
−
p
)
)
,
{\displaystyle Y=N(np,np(1-p)),}
ovvero una gaussiana con media
n
p
{\displaystyle np}
e varianza
n
p
(
1
−
p
)
{\displaystyle np(1-p)}
.
Se standardizziamo:
lim
n
→
∞
Y
n
−
n
p
n
p
(
1
−
p
)
=
Z
.
{\displaystyle \lim _{n\to \infty }{\frac {Y_{n}-np}{\sqrt {np(1-p)}}}=Z.}
Questo teorema è molto utile nel caso si vogliano valori approssimati del numero di successi nella ripetizione di un esperimento indipendente dagli esiti passati, visto che la variabile aleatoria binomiale risulta spesso difficile da calcolare con numeri elevati.
L'approssimazione è tanto migliore quanto più è alto il numero di esperimenti.
Dimostrazione
Il teorema di De Moivre-Laplace può essere dimostrato più facilmente del teorema Centrale del Limite, con una prova per la quale è necessaria la conoscenza degli sviluppi di Taylor e dell'Approssimazione di Stirling .
Per il fattoriale di un numero n sufficientemente grande vale la formula di Stirling, secondo cui:
n
!
≃
2
π
n
(
n
e
)
n
{\displaystyle n!\simeq {\sqrt {2\pi n}}\left({\frac {n}{e}}\right)^{n}}
o, equivalentemente:
n
!
≃
n
n
e
−
n
2
π
n
{\displaystyle n!\simeq n^{n}e^{-n}{\sqrt {2\pi n}}}
La funzione di densità di
B
i
(
n
,
p
)
{\displaystyle Bi(n,p)}
si potrà scrivere allora come:
(
n
k
)
p
k
q
n
−
k
=
n
!
k
!
(
n
−
k
)
!
p
k
q
n
−
k
≃
n
n
e
−
n
2
π
n
k
k
e
−
k
2
π
k
(
n
−
k
)
n
−
k
e
−
(
n
−
k
)
2
π
(
n
−
k
)
p
k
q
n
−
k
=
[
2
π
n
2
π
k
2
π
(
n
−
k
)
]
[
n
n
k
k
(
n
−
k
)
n
−
k
]
[
e
−
n
e
−
k
e
−
(
n
−
k
)
]
p
k
q
n
−
k
=
[
n
k
2
π
(
n
−
k
)
]
[
n
n
k
k
(
n
−
k
)
n
−
k
]
[
e
−
n
e
−
k
e
−
n
e
k
]
p
k
q
n
−
k
=
[
n
2
π
k
(
n
−
k
)
]
[
n
n
(
p
k
)
k
(
q
n
−
k
)
(
n
−
k
)
]
e
−
n
+
k
+
n
−
k
=
[
n
2
π
k
(
n
−
k
)
]
[
n
n
−
k
+
k
(
p
k
)
k
(
q
n
−
k
)
(
n
−
k
)
]
=
[
n
2
π
k
(
n
−
k
)
]
[
n
n
−
k
n
k
(
p
k
)
k
(
q
n
−
k
)
(
n
−
k
)
]
=
[
n
2
π
k
(
n
−
k
)
]
[
(
n
p
k
)
k
(
n
q
n
−
k
)
(
n
−
k
)
]
=
[
n
2
π
k
(
n
−
k
)
]
[
(
k
n
p
)
−
k
(
n
−
k
n
q
)
−
(
n
−
k
)
]
{\displaystyle {\begin{aligned}{n \choose k}\,p^{k}q^{n-k}&={\frac {n!}{k!\left(n-k\right)!}}p^{k}q^{n-k}\\&\simeq {\frac {n^{n}e^{-n}{\sqrt {2\pi n}}}{k^{k}e^{-k}{\sqrt {2\pi k}}{(n-k)}^{n-k}e^{-(n-k)}{\sqrt {2\pi (n-k)}}}}p^{k}q^{n-k}\\&=\left[{\frac {\sqrt {2\pi n}}{{\sqrt {2\pi k}}{\sqrt {2\pi (n-k)}}}}\right]\left[{\frac {n^{n}}{k^{k}{(n-k)}^{n-k}}}\right]\left[{\frac {e^{-n}}{e^{-k}e^{-(n-k)}}}\right]p^{k}q^{n-k}\\&=\left[{\frac {\sqrt {n}}{{\sqrt {k}}{\sqrt {2\pi (n-k)}}}}\right]\left[{\frac {n^{n}}{k^{k}{(n-k)}^{n-k}}}\right]\left[{\frac {e^{-n}}{e^{-k}e^{-n}{e}^{k}}}\right]p^{k}q^{n-k}\\&=\left[{\sqrt {\frac {n}{2\pi k(n-k)}}}\right]\left[n^{n}{\left({\frac {p}{k}}\right)}^{k}{\left({\frac {q}{n-k}}\right)}^{(n-k)}\right]e^{-n+k+n-k}\\&=\left[{\sqrt {\frac {n}{2\pi k(n-k)}}}\right]\left[n^{n-k+k}{\left({\frac {p}{k}}\right)}^{k}{\left({\frac {q}{n-k}}\right)}^{(n-k)}\right]\\&=\left[{\sqrt {\frac {n}{2\pi k(n-k)}}}\right]\left[n^{n-k}n^{k}{\left({\frac {p}{k}}\right)}^{k}{\left({\frac {q}{n-k}}\right)}^{(n-k)}\right]\\&=\left[{\sqrt {\frac {n}{2\pi k(n-k)}}}\right]\left[{\left({\frac {np}{k}}\right)}^{k}{\left({\frac {nq}{n-k}}\right)}^{(n-k)}\right]\\&=\left[{\sqrt {\frac {n}{2\pi k(n-k)}}}\right]\left[{\left({\frac {k}{np}}\right)}^{-k}{\left({\frac {n-k}{nq}}\right)}^{-(n-k)}\right]\\\end{aligned}}}
Sia ora
x
=
(
k
−
n
p
)
n
p
q
{\displaystyle x={\frac {(k-np)}{\sqrt {npq}}}}
⇒
k
=
n
p
+
x
n
p
q
{\displaystyle \Rightarrow \ k=np+x{\sqrt {npq}}}
and
n
−
k
=
n
q
−
x
n
p
q
{\displaystyle n-k=nq-x{\sqrt {npq}}}
⇒
k
n
p
=
1
+
x
q
n
p
{\displaystyle \Rightarrow \ {\frac {k}{np}}=1+x{\sqrt {\frac {q}{np}}}}
and
n
−
k
n
q
=
1
−
x
p
n
q
{\displaystyle {\frac {n-k}{nq}}=1-x{\sqrt {\frac {p}{nq}}}}
⇒
(
n
k
)
p
k
q
n
−
k
≃
[
n
2
π
k
(
n
−
k
)
]
[
(
1
+
x
q
n
p
)
−
k
(
1
−
x
p
n
q
)
−
(
n
−
k
)
]
{\displaystyle \Rightarrow \ {n \choose k}p^{k}q^{n-k}\simeq \left[{\sqrt {\frac {n}{2{\mathbf {\pi } }k(n-k)}}}\right]\left[{\left(1+x{\sqrt {\frac {q}{np}}}\right)}^{-k}{\left(1-x{\sqrt {\frac {p}{nq}}}\right)}^{-(n-k)}\right]}
Consideriamo dapprima il primo termine tra parentesi quadre nell'ultima uguaglianza:
n
2
π
k
(
n
−
k
)
=
n
2
π
k
(
n
−
k
)
×
1
/
n
2
1
/
n
2
=
1
/
n
2
π
k
(
n
−
k
)
/
n
2
=
1
/
n
2
π
k
n
(
n
−
k
)
n
=
1
/
n
2
π
k
n
(
1
−
k
n
)
=
1
/
n
2
π
p
(
1
−
p
)
[
∵
k
→
n
p
⇒
k
n
→
p
]
=
1
/
n
2
π
p
q
[
∵
p
+
q
=
1
⇒
q
=
1
−
p
]
=
1
2
π
n
p
q
=
1
2
π
n
p
q
{\displaystyle {\begin{aligned}{\sqrt {\frac {n}{2\pi k\left(n-k\right)}}}&={\sqrt {{\frac {n}{2\pi k\left(n-k\right)}}\times {\frac {{1}/{n^{2}}}{{1}/{n^{2}}}}}}\\&={\sqrt {\frac {{1}/{n}}{{2\pi k(n-k)}/{n^{2}}}}}\\&={\sqrt {\frac {{1}/{n}}{2\pi {\frac {k}{n}}{\frac {(n-k)}{n}}}}}\\&={\sqrt {\frac {{1}/{n}}{2\pi {\frac {k}{n}}\left(1-{\frac {k}{n}}\right)}}}\\&={\sqrt {\frac {{1}/{n}}{2\pi p\left(1-p\right)}}}\qquad \qquad \qquad \left[\because k\to np\Rightarrow {\frac {k}{n}}\to p\right]\\&={\sqrt {\frac {{1}/{n}}{2\pi pq}}}\qquad \qquad \qquad \left[\because p+q=1\Rightarrow q=1-p\right]\\&={\sqrt {\frac {1}{2\pi npq}}}\\&={\frac {1}{\sqrt {2\pi npq}}}\\\end{aligned}}}
⇒
(
n
k
)
p
k
q
n
−
k
≃
1
2
π
n
p
q
[
(
1
+
x
q
n
p
)
−
k
(
1
−
x
p
n
q
)
−
(
n
−
k
)
]
{\displaystyle \Rightarrow {n \choose k}p^{k}q^{n-k}\simeq {\frac {1}{\sqrt {2{\mathbf {\pi } }npq}}}\left[{\left(1+x{\sqrt {\frac {q}{np}}}\right)}^{-k}{\left(1-x{\sqrt {\frac {p}{nq}}}\right)}^{-(n-k)}\right]}
E quindi il secondo termine tra parentesi quadrate:
[
(
1
+
x
q
n
p
)
−
k
(
1
−
x
p
n
q
)
−
(
n
−
k
)
]
=
e
ln
[
(
1
+
x
q
n
p
)
−
k
(
1
−
x
p
n
q
)
−
(
n
−
k
)
]
{\displaystyle \left[{\left(1+x{\sqrt {\frac {q}{np}}}\right)}^{-k}{\left(1-x{\sqrt {\frac {p}{nq}}}\right)}^{-\left(n-k\right)}\right]=e^{\ln \left[{\left(1+x{\sqrt {\frac {q}{np}}}\right)}^{-k}{\left(1-x{\sqrt {\frac {p}{nq}}}\right)}^{-\left(n-k\right)}\right]}}
Per cui si ha che:
(
n
k
)
p
k
q
n
−
k
≃
1
2
π
n
p
q
e
ln
[
(
1
+
x
q
n
p
)
−
k
(
1
−
x
p
n
q
)
−
(
n
−
k
)
]
{\displaystyle {n \choose k}p^{k}q^{n-k}\simeq {\frac {1}{\sqrt {2{\mathbf {\pi } }npq}}}e^{\ln \left[{\left(1+x{\sqrt {\frac {q}{np}}}\right)}^{-k}{\left(1-x{\sqrt {\frac {p}{nq}}}\right)}^{-\left(n-k\right)}\right]}}
Consideriamo quindi il logarimo naturale che appare nell'ultima uguaglianza.
ln
[
(
1
+
x
q
n
p
)
−
k
(
1
−
x
p
n
q
)
−
(
n
−
k
)
]
=
ln
(
1
+
x
q
n
p
)
−
k
+
ln
(
1
−
x
p
n
q
)
−
(
n
−
k
)
=
−
k
ln
(
1
+
x
q
n
p
)
−
(
n
−
k
)
ln
(
1
−
x
p
n
q
)
{\displaystyle {\begin{aligned}\ln \left[{\left(1+x{\sqrt {\frac {q}{np}}}\right)}^{-k}{\left(1-x{\sqrt {\frac {p}{nq}}}\right)}^{-\left(n-k\right)}\right]&=\ln {\left(1+x{\sqrt {\frac {q}{np}}}\right)}^{-k}+\ln {\left(1-x{\sqrt {\frac {p}{nq}}}\right)}^{-\left(n-k\right)}\\&=-k\ln \left(1+x{\sqrt {\frac {q}{np}}}\right)-\left(n-k\right)\ln \left(1-x{\sqrt {\frac {p}{nq}}}\right)\\\end{aligned}}}
Utilizzando le espansioni di Taylor seguenti:-
ln
(
1
+
y
)
=
y
−
y
2
2
+
y
3
3
−
y
4
4
+
⋯
{\displaystyle \ln \left(1+y\right)=y-{\frac {y^{2}}{2}}+{\frac {y^{3}}{3}}-{\frac {y^{4}}{4}}+\cdots }
ln
(
1
−
y
)
=
−
y
−
y
2
2
−
y
3
3
−
y
4
4
−
⋯
{\displaystyle \ln \left(1-y\right)=-y-{\frac {y^{2}}{2}}-{\frac {y^{3}}{3}}-{\frac {y^{4}}{4}}-\cdots }
si ha:
ln
(
1
+
x
q
n
p
)
=
x
q
n
p
−
x
2
q
2
n
p
+
⋯
{\displaystyle \ln \left(1+x{\sqrt {\frac {q}{np}}}\right)=x{\sqrt {\frac {q}{np}}}-{\frac {x^{2}q}{2np}}+\cdots }
e
ln
(
1
−
x
p
n
q
)
=
−
x
p
n
q
−
x
2
p
2
n
q
−
⋯
{\displaystyle \ln \left(1-x{\sqrt {\frac {p}{nq}}}\right)=-x{\sqrt {\frac {p}{nq}}}-{\frac {x^{2}p}{2nq}}-\cdots }
⇒
ln
[
(
1
+
x
q
n
p
)
−
k
(
1
−
x
p
n
q
)
−
(
n
−
k
)
]
=
−
k
(
x
q
n
p
−
x
2
q
2
n
p
+
⋯
)
−
(
n
−
k
)
(
−
x
p
n
q
−
x
2
p
2
n
q
−
⋯
)
=
−
(
n
p
+
x
n
p
q
)
(
x
q
n
p
−
x
2
q
2
n
p
+
⋯
)
−
(
n
q
−
x
n
p
q
)
(
−
x
p
n
q
−
x
2
p
2
n
q
−
⋯
)
{\displaystyle {\begin{aligned}\Rightarrow {\ln \left[{\left(1+x{\sqrt {\frac {q}{np}}}\right)}^{-k}{\left(1-x{\sqrt {\frac {p}{nq}}}\right)}^{-\left(n-k\right)}\right]}&=-k\left(x{\sqrt {\frac {q}{np}}}-{\frac {x^{2}q}{2np}}+\cdots \right)-\left(n-k\right)\left(-x{\sqrt {\frac {p}{nq}}}-{\frac {x^{2}p}{2nq}}-\cdots \right)\\&=-\left(np+x{\sqrt {npq}}\right)\left(x{\sqrt {\frac {q}{np}}}-{\frac {x^{2}q}{2np}}+\cdots \right)\\&-\left(nq-x{\sqrt {npq}}\right)\left(-x{\sqrt {\frac {p}{nq}}}-{\frac {x^{2}p}{2nq}}-\cdots \right)\\\end{aligned}}}
per cui
⇒
ln
[
(
1
+
x
q
n
p
)
−
k
(
1
−
x
p
n
q
)
−
(
n
−
k
)
]
=
−
(
n
p
×
x
q
n
p
−
n
p
×
x
2
q
2
n
p
+
x
n
p
q
×
x
q
n
p
−
x
n
p
q
×
x
2
q
2
n
p
+
⋯
)
−
(
−
n
q
×
x
p
n
q
−
n
q
×
x
2
p
2
n
q
+
x
n
p
q
×
x
p
n
q
+
x
n
p
q
×
x
2
p
2
n
q
+
⋯
)
=
−
(
x
n
p
q
−
x
2
q
2
+
x
2
q
+
⋯
)
−
(
−
x
n
p
q
−
x
2
p
2
+
x
2
p
+
⋯
)
=
−
(
x
n
p
q
+
x
2
q
2
+
⋯
)
−
(
−
x
n
p
q
+
x
2
p
2
+
⋯
)
=
−
x
n
p
q
−
x
2
q
2
+
x
n
p
q
−
x
2
p
2
−
⋯
=
−
x
2
q
2
−
x
2
p
2
−
⋯
=
−
x
2
2
(
q
+
p
)
−
⋯
=
−
x
2
2
−
⋯
{\displaystyle {\begin{aligned}\Rightarrow {\ln \left[{\left(1+x{\sqrt {\frac {q}{np}}}\right)}^{-k}{\left(1-x{\sqrt {\frac {p}{nq}}}\right)}^{-\left(n-k\right)}\right]}&=-\left(np\times x{\sqrt {\frac {q}{np}}}-np\times {\frac {x^{2}q}{2np}}+x{\sqrt {npq}}\times x{\sqrt {\frac {q}{np}}}-x{\sqrt {npq}}\times {\frac {x^{2}q}{2np}}+\cdots \right)\\&-\left(-nq\times x{\sqrt {\frac {p}{nq}}}-nq\times {\frac {x^{2}p}{2nq}}+x{\sqrt {npq}}\times x{\sqrt {\frac {p}{nq}}}+x{\sqrt {npq}}\times {\frac {x^{2}p}{2nq}}+\cdots \right)\\&=-\left(x{\sqrt {npq}}-{\frac {x^{2}q}{2}}+x^{2}q+\cdots \right)-\left(-x{\sqrt {npq}}-{\frac {x^{2}p}{2}}+x^{2}p+\cdots \right)\\&=-\left(x{\sqrt {npq}}+{\frac {x^{2}q}{2}}+\cdots \right)-\left(-x{\sqrt {npq}}+{\frac {x^{2}p}{2}}+\cdots \right)\\&=-x{\sqrt {npq}}-{\frac {x^{2}q}{2}}+x{\sqrt {npq}}-{\frac {x^{2}p}{2}}-\cdots \\&=-{\frac {x^{2}q}{2}}-{\frac {x^{2}p}{2}}-\cdots \\&=-{\frac {x^{2}}{2}}\left(q+p\right)-\cdots \\&=-{\frac {x^{2}}{2}}-\cdots \\\end{aligned}}}
⇒
ln
[
(
1
+
x
q
n
p
)
−
k
(
1
−
x
p
n
q
)
−
(
n
−
k
)
]
≃
−
x
2
2
{\displaystyle \Rightarrow {\ln \left[{\left(1+x{\sqrt {\frac {q}{np}}}\right)}^{-k}{\left(1-x{\sqrt {\frac {p}{nq}}}\right)}^{-\left(n-k\right)}\right]}\simeq -{\frac {x^{2}}{2}}}
⇒
(
n
k
)
p
k
q
n
−
k
≃
1
2
π
n
p
q
e
ln
[
(
1
+
x
q
n
p
)
−
k
(
1
−
x
p
n
q
)
−
(
n
−
k
)
]
≃
1
2
π
n
p
q
e
−
x
2
/
2
{\displaystyle \Rightarrow {n \choose k}p^{k}q^{n-k}\simeq {\frac {1}{\sqrt {2{\mathbf {\pi } }npq}}}e^{\ln \left[{\left(1+x{\sqrt {\frac {q}{np}}}\right)}^{-k}{\left(1-x{\sqrt {\frac {p}{nq}}}\right)}^{-\left(n-k\right)}\right]}\simeq {\frac {1}{\sqrt {2{\mathbf {\pi } }npq}}}e^{{-x^{2}}/{2}}}
Possiamo ignorare i termini di grado maggiore del secondo, essendo
x
{\displaystyle x}
proporzionale a
(
k
−
n
p
)
{\displaystyle (k-np)}
che tende a 0 al crescere di
n
{\displaystyle n}
.
Dunque, elevando al quadrato e dividendo per due x, si ha:
x
2
2
=
(
(
k
−
n
p
)
n
p
q
)
2
2
=
(
k
−
n
p
)
2
2
n
p
q
{\displaystyle {\frac {x^{2}}{2}}={\frac {{\left({\frac {(k-np)}{\sqrt {npq}}}\right)}^{2}}{2}}={\frac {{\left(k-np\right)}^{2}}{2npq}}}
Quindi,
(
n
k
)
p
k
(
1
−
p
)
n
−
k
≃
1
2
π
n
p
(
1
−
p
)
e
−
(
k
−
n
p
)
2
/
2
n
p
(
1
−
p
)
{\displaystyle {n \choose k}p^{k}(1-p)^{n-k}\simeq {\frac {1}{\sqrt {2{\mathbf {\pi } }np(1-p)}}}e^{{-{\left(k-np\right)}^{2}}/{2np(1-p)}}}
che è esattamente l'asserto che volevamo provare - il termine a destra è una distribuzione gaussiana con media
n
p
{\displaystyle np}
e varianza
n
p
(
1
−
p
)
{\displaystyle np(1-p)}
.
Note
Bibliografia
Sheldon M. Ross, Probabilità e statistica per l'ingegneria e le scienze , Trento, Apogeo, 2003, ISBN 88-7303-897-2 .
Voci correlate
Altri progetti