Teorema del Limite Centrale
Da Wikipedia, l'enciclopedia libera.
| Questa voce di matematica sembra trattare lo stesso argomento, o comunque argomenti unificabili, della voce Teorema del limite centrale. stesso argomento Puoi contribuire unendo i contenuti in una pagina unica seguendo le linee guida. |
Il teorema del Limite Centrale è un teorema molto importante in statistica nella teoria dell'inferenza statistica e nella teoria della stima intervallare. Infatti il teorema mi dice che se ho una somma di v.c. Xi i.i.d., indipendentemente dalla forma distributiva di partenza, al tendere della dimensione campionaria a infinito, tende a distribuirsi come una v.c. Normale. In formule:

e standardizzando:

dove
è la v.c. media campionaria.
[modifica] Teorema di De Moivre-Laplace
Un corollario importante del teorema del Limite Centrale è il seguente:
Se Y = Bi(n,p) è una v.c. casuale binomiale, che possiamo vedere come somma di n v.c. bernoulliane. Allora per
:
Y = N(np,np(1 − p)),
ovvero una normale con media np e varianza np(1-p).
Se standardizzo:

[modifica] Utilizzo del teorema
Questi risultati sono molto importanti nella costruzione degli intervalli di confidenza per i parametri della popolazione e per la verifica d'ipotesi su medie, proporzioni, ecc. Infatti, sapendo che la distribuzione asintotica dello stimatore è normale, possiamo calcolare le probabilità dei valori critici del test con la tavola della normale standard, semplificando il problema in quanto per la t di Student che si usa nell'inferenza su medie quando non si conosce la varianza e il campione è piccolo, sono tabulati solo pochi percentili per dati livelli di significatività del test in corrispondenza di alcuni gdl. Con Excel non ci sono problemi perché posso calcolare le probabilità esatte con le funzioni statistiche. Ad esempio i percentili della t di Student li calcolo con la funzione INV.T. Comunque il teorema viene applicato bene nel test z e negli intevalli di confidenza per la media e le percentuali. Per le medie se la varianza non è nota la distribuzione esatta è la t, ma asintoticamente la t è normale (al crescere dei gdl tende alla Z) e quindi per grandi campioni n>30 per campioni bernoulliani, o n>100 per campioni nello schema di campionamento senza ripetizione, si usa la Z.

