Distribuzione t di Student

Da Wikipedia, l'enciclopedia libera.
(Reindirizzamento da Variabile casuale t di Student)
Vai a: navigazione, cerca
distribuzione t di Student
Funzione di densità di probabilità
Funzione di densità di probabilità
Funzione di ripartizione
Funzione di ripartizione
Parametri n>0\ (gradi di libertà)
Supporto \mathbb{R}
Funzione di densità \frac{\Gamma(\frac{n+1}{2})}{\sqrt{n\pi}\Gamma(\frac{n}{2})} \left(1+\frac{t^2}{n}\right)^{-(\frac{n+1}{2})}
Funzione di ripartizione \frac {\Beta(\frac{t+\sqrt{t^2+n}}{2\sqrt{t^2+n}},\frac{n}{2},\frac{n}{2})} {\Beta(\frac{n}{2},\frac{n}{2})}


dove Β è la funzione Beta

Valore atteso 0\ se n > 1
non definita altrimenti
Mediana 0\,\!
Moda 0\,\!
Varianza \frac{n}{n-2}\ se n > 2
infinita altrimenti
Skewness 0\ se n > 3
non definita altrimenti
Curtosi \frac{6}{n-4}\ se n > 4
infinita altrimenti
Entropia \tfrac{n+1}{2}\left(\digamma(\tfrac{1+n}{2})-\digamma(\tfrac{n}{2})\right)+\log{\left(\sqrt{n}\Beta(\tfrac{n}{2},\tfrac{1}{2})\right)}

dove \digamma è la funzione digamma e Β è la funzione Beta

Funz. Gen. dei Momenti
Funz. Caratteristica \frac{K_{n/2}(\sqrt{n}|t|)(\sqrt{n}|t|)^{n/2}}{\Gamma(n/2)2^{n/2-1}}[1]

dove Kn(x) è una funzione di Bessel

In teoria delle probabilità la distribuzione di Student, o t di Student, è una distribuzione di probabilità continua che governa il rapporto tra due variabili aleatorie, la prima con distribuzione normale e la seconda il cui quadrato ha distribuzione chi quadrato.

Questa distribuzione interviene nella stima della media di una popolazione che segue la distribuzione normale, e viene utilizzata negli omonimi test t di Student per la significatività e per ogni intervallo di confidenza della differenza tra due medie.

Indice

[modifica] Cenni storici

La distribuzione venne descritta nel 1908 da William Sealy Gosset, che pubblicò il suo risultato sotto lo pseudonimo "Student" perché la birreria presso la quale era impiegato vietava ai propri dipendenti di pubblicare articoli affinché questi non divulgassero segreti di produzione. Il nome distribuzione di Student venne successivamente introdotto da Ronald Fisher.[2][3]

[modifica] Definizione

La distribuzione di Student con parametro n (gradi di libertà) governa la variabile aleatoria

T=\frac{Z}{\sqrt{S^2/n}}

dove Z e S2 sono due variabili aleatorie indipendenti che seguono rispettivamente la distribuzione normale standard \mathcal{N}(0,1) e la distribuzione chi quadrato χ2(n) con n gradi di libertà.

[modifica] Stimatore

La media μ e la varianza σ2 di una popolazione X possono essere stimate tramite un suo campione di taglia n, X1,...,Xn con gli stimatori

\bar{X}=\frac{\sum_iX_i}{n},
S_{n-1}^2=\frac{\sum_i(X_i-\bar{X})^2}{n-1}.

La variabile aleatoria

Z=\frac{\bar{X}-\mu}{\sqrt{\sigma^2/n}}

segue una distribuzione normale standard, \mathcal{N}(0,1), mentre la variabile aleatoria

V=\frac{(n-1)S_{n-1}^2}{\sigma^2}

segue una distribuzione chi quadrato con n-1 gradi di libertà, χ2(n − 1). Le due variabili aleatorie sono indipendenti, per il teorema di Cochran.

Senza conoscere la varianza σ2 non è possibile confrontare gli stimatori \bar{X} e S_{n-1}^2 con Z e V, che hanno distribuzioni di probabilità note. Ciononostante la variabile aleatoria

T=\frac{\bar{X}-\mu}{\sqrt{S_{n-1}^2/n}}=\frac{\bar{X}-\mu}{\sqrt{\frac{\sigma^2}{n}\frac{(n-1)S^2}{(n-1)\sigma^2}}}=\frac{Z}{\sqrt{V/(n-1)}}

(ottenuta "sostituendo" S_{n-1}^2 a σ2 nella definizione di Z) segue la distribuzione di Student con n-1 gradi di libertà.

[modifica] Caratteristiche

La distribuzione di Student con n gradi di libertà è simmetrica, perché lo è la distribuzione normale standard mentre la distribuzione chi quadrato che funge da "parametro casuale di scala" non produce effetti di distorsione di tale simmetria.

La sua funzione di densità di probabilità è

f(t) = \frac{\Gamma(\frac{n+1}{2})}{\sqrt{n\pi}\Gamma(\frac{n}{2})} \left(1+\frac{t^2}{n}\right)^{-(n+1)/2}
 = \frac{1}{\sqrt{n}\Beta(\frac{1}{2},\frac{n}{2})} \left(1+\frac{t^2}{n}\right)^{-(n+1)/2},

dove Γ indica la funzione Gamma e Β la funzione Beta.

La sua funzione di ripartizione è

F(t)=I_x\left(\frac{n}{2},\frac{n}{2}\right),

dove I_x(a,b)=\frac{\Beta(x,a,b)}{\Beta(a,b)} è la funzione Beta incompleta regolarizzata e

x=\frac{t+\sqrt{t^2+n}}{2\sqrt{t^2+n}}.

Per k < n i momenti (semplici o centrali) di ordine k della distribuzione sono

μk = 0 se k è dispari,
\mu_k=\frac{\Gamma(\frac{k+1}{2})\Gamma(\frac{n-k}{2})n^{k/2}}{\sqrt{\pi}\Gamma(\frac{n}{2})} se k è pari.

In particolare, oltre alla speranza matematica E[T] = 0 e all'indice di asimmetria γ1 = 0 (per n > 3) predetti dalla simmetria della distribuzione, si trovano:

la varianza \text{Var}(T)=\frac{n}{n-2} per n > 2;
l'indice di curtosi \gamma_2=\frac{6}{n-4} per n > 4.

[modifica] Statistica

[modifica] Intervallo di confidenza

La distribuzione di Student viene utilizzata per definire degli intervalli di confidenza per la media di una popolazione, sulla base degli stimatori puntuali \bar{X} e S_n^2 della sua media e della sua varianza. Dall'equazione

T=\frac{\bar{X}-\mu}{\sqrt{S_n^2/n}}

si ha infatti

P(a\leqslant T\leqslant b)=P\left(\bar{X}-b\sqrt{S_n^2/n}\leqslant\mu\leqslant\bar{X}-a\sqrt{S_n^2/n}\right).

Scegliendo quindi dei quantili qα < qβ per la distribuzione di Student con n gradi di libertà, si ha

\beta-\alpha=P(q_{\alpha}\leqslant T\leqslant q_{\beta})=P\left(\bar{X}-q_{\beta}\sqrt{S_n^2/n}\leqslant\mu\leqslant\bar{X}-q_{\alpha}\sqrt{S_n^2/n}\right),

cioè un intervallo di confidenza per la media μ con livello di confidenza β − α è:

\left[\ \bar{X}-q_{\beta}\sqrt{S_n^2/n}\ ,\ \bar{X}-q_{\alpha}\sqrt{S_n^2/n}\ \right].

Qualora si considerino intervalli simmetrici si può utilizzare l'indice zα definito da

\alpha=P(|T|\leqslant z_\alpha)=P(-z_\alpha\leqslant T\leqslant z_\alpha)=2F(z_\alpha)-1,

ovvero

z_\alpha=q_{\frac{1+\alpha}{2}},

e si ottiene l'intervallo di confidenza per μ con livello di confidenza α

\left[\ \bar{X}-z_{\alpha}\sqrt{S_n^2/n}\ ,\ \bar{X}+z_{\alpha}\sqrt{S_n^2/n}\ \right].

[modifica] Altre distribuzioni

La distribuzione di Student con parametro n = 1 corrisponde alla distribuzione di Cauchy di parametri (0,1): entrambe regolano il rapporto X / Y tra due variabili aleatorie indipendenti aventi distribuzione normale standard.

Al tendere di n a infinito la distribuzione di Student con n gradi di libertà converge alla distribuzione normale standard \mathcal{N}(0,1).

La distribuzione di Fisher-Snedecor di parametri (1,n) corrisponde alla distribuzione di Student di parametro n e ne è quindi una generalizzazione.

[modifica] Tabella dei quantili

La seguente tabella[4] esprime, in funzione del parametro n (riga) e di particolari valori di α (colonna), i quantili qα per la distribuzione di Student di parametro n:

P(T\leqslant q_\alpha)=F(q_\alpha)=\alpha.

L'ultima riga, indicata con "\infty", si riferisce ad una distribuzione normale standard.

n\α 0.90 0.95 0.975 0.99 0.995 0.9975 0.999 0.9995
1 3.078 6.314 12.706 31.821 63.657 127.321 318.309 636.619
2 1.886 2.920 4.303 6.965 9.925 14.089 22.327 31.599
3 1.638 2.353 3.182 4.541 5.841 7.453 10.215 12.924
4 1.533 2.132 2.776 3.747 4.604 5.598 7.173 8.610
5 1.476 2.015 2.571 3.365 4.032 4.773 5.893 6.869
6 1.440 1.943 2.447 3.143 3.707 4.317 5.208 5.959
7 1.415 1.895 2.365 2.998 3.499 4.029 4.785 5.408
8 1.397 1.860 2.306 2.896 3.355 3.833 4.501 5.041
9 1.383 1.833 2.262 2.821 3.250 3.690 4.297 4.781
10 1.372 1.812 2.228 2.764 3.169 3.581 4.144 4.587
11 1.363 1.796 2.201 2.718 3.106 3.497 4.025 4.437
12 1.356 1.782 2.179 2.681 3.055 3.428 3.930 4.318
13 1.350 1.771 2.160 2.650 3.012 3.372 3.852 4.221
14 1.345 1.761 2.145 2.624 2.977 3.326 3.787 4.140
15 1.341 1.753 2.131 2.602 2.947 3.286 3.733 4.073
16 1.337 1.746 2.120 2.583 2.921 3.252 3.686 4.015
17 1.333 1.740 2.110 2.567 2.898 3.222 3.646 3.965
18 1.330 1.734 2.101 2.552 2.878 3.197 3.610 3.922
19 1.328 1.729 2.093 2.539 2.861 3.174 3.579 3.883
20 1.325 1.725 2.086 2.528 2.845 3.153 3.552 3.850
21 1.323 1.721 2.080 2.518 2.831 3.135 3.527 3.819
22 1.321 1.717 2.074 2.508 2.819 3.119 3.505 3.792
23 1.319 1.714 2.069 2.500 2.807 3.104 3.485 3.768
24 1.318 1.711 2.064 2.492 2.797 3.091 3.467 3.745
25 1.316 1.708 2.060 2.485 2.787 3.078 3.450 3.725
26 1.315 1.706 2.056 2.479 2.779 3.067 3.435 3.707
27 1.314 1.703 2.052 2.473 2.771 3.057 3.421 3.690
28 1.313 1.701 2.048 2.467 2.763 3.047 3.408 3.674
29 1.311 1.699 2.045 2.462 2.756 3.038 3.396 3.659
30 1.310 1.697 2.042 2.457 2.750 3.030 3.385 3.646
40 1.303 1.684 2.021 2.423 2.704 2.971 3.307 3.551
50 1.299 1.676 2.009 2.403 2.678 2.937 3.261 3.496
60 1.296 1.671 2.000 2.390 2.660 2.915 3.232 3.460
100 1.290 1.660 1.984 2.364 2.626 2.871 3.174 3.390
\infty 1.282 1.645 1.960 2.326 2.576 2.807 3.090 3.291

[modifica] Note

  1. ^ Hurst, Simon, The Characteristic Function of the Student-t Distribution, Financial Mathematics Research Report No. FMRR006-95, Statistics Research Report No. SRR044-95
  2. ^ Student (William Sealy Gosset) (Marzo 1908). The probable error of a mean. Biometrika 6 (1): 1–-25  (in (EN)). DOI:10.1093/biomet/6.1.1.
  3. ^ Ronald Fisher (1925). Applications of "Student's" distribution. Metron 5: 90-–104  (in (EN)).
  4. ^ Valori critici calcolati con la funzione qt(p,g) di R.

[modifica] Voci correlate

[modifica] Altri progetti

[modifica] Collegamenti esterni

matematica Portale Matematica: accedi alle voci di Wikipedia che trattano di matematica
Strumenti personali
Namespace
Varianti
Azioni
Navigazione
Comunità
Stampa/esporta
Strumenti
Altre lingue