Simmetria (statistica)

Da Wikipedia, l'enciclopedia libera.
Esempio di dati sperimentali che presentano asimmetria

In teoria delle probabilità una distribuzione di probabilità è simmetrica quando la sua funzione di probabilità P (nel caso discreto) o la sua funzione di densità di probabilità (nel caso continuo) siano simmetriche rispetto ad un valore fissato x_0:

P(x_0+x)=P(x_0-x) oppure f(x_0+x)=f(x_0-x).

Esempi di distribuzioni simmetriche sono le distribuzioni uniformi (discreta e distribuzione continua uniforme) su insiemi simmetrici, la distribuzione normale e altre distribuzioni derivate da distribuzioni simmetriche (la distribuzione t di Student) oppure definite in maniera simmetrica (la distribuzione di Skellam con parametri uguali).

Un indice di asimmetria (in inglese skewness) di una distribuzione è un valore che cerca di fornire una misura della sua mancanza di simmetria.

Esistono diversi indici di asimmetria. Per ognuno di essi il valore 0 fornisce una condizione necessaria, ma non sufficiente, affinché una distribuzione sia simmetrica. (Ogni distribuzione simmetrica ha indice 0, ma esistono anche distribuzioni non simmetriche con indice 0).

Gli indici di asimmetria comunemente utilizzati si basano su alcune proprietà delle distribuzioni simmetriche o, in particolare, della distribuzione normale. Per tutte queste

Indice di asimmetria[modifica | modifica sorgente]

L'indice più utilizzato, noto semplicemente come indice di asimmetria o skewness, è definito come

\gamma_1=\frac{m_3}{m_2^{3/2}}

tramite i momenti centrali m_k=E[\bar{X}^k], ovvero i valori attesi delle potenze della variabile aleatoria centrata \bar{X}=X-E[X].

Poiché il primo momento centrale è sempre nullo ed il secondo momento centrale (la varianza) è nullo solo per le distribuzioni concentrate su un unico valore, il terzo momento centrale m_3 è quello di ordine più basso che può "sperare" di misurare l'asimmetria di una distribuzione. Inoltre il riscalamento per m_2^{3/2} permette all'indice \gamma_1 di restare invariato per trasformazioni lineari Y=aX+b, che trasformano i momenti centrali come m_k(aX+b)=a^km_k(X).

Talvolta viene utilizzato al posto di \gamma_1 l'indice

\beta_1=\gamma_1^2=\frac{m_3^2}{m_2^3}

che tuttavia perde l'informazione sul segno dell'asimmetria.

In statistica l'indice di asimmetria calcolato su un campione osservato \{x_1,...,x_n\} di media \bar{x} segue la formula

g_1=\frac{\sum_{i=1}^n\frac{1}{n}(x_i-\bar{x})^3}{\left(\sum_{i=1}^n\frac{1}{n}(x_i-\bar{x})^2\right)^{3/2}}.

Il successivo momento centrale m_4 viene invece utilizzato per calcolare la curtosi (che vuole "misurare" l'allontanamento della distribuzione dalla distribuzione normale).

Proprietà[modifica | modifica sorgente]

Ogni distribuzione simmetrica ha indice di asimmetria 0.

La somma Y=X_1+...+X_n di n variabili aleatorie variabili indipendenti con la stessa distribuzione ha momenti centrali m_k(Y)=nm_k(X); in particolare

\gamma_1(Y)=\frac{1}{\sqrt{n}}\gamma_1(X)

Una convinzione sbagliata ma diffusa (e "sostenuta" da alcuni testi che la riportano come regola indicativa) è che il segno del coefficiente \gamma_1 possa determinare le posizioni reciproche del valore atteso, della mediana e della moda (se questa è unica) di una distribuzione, in particolare che esse debbano coincidere se \gamma_1=0.[1]

Indice di Pearson[modifica | modifica sorgente]

Alcuni indici di asimmetria alternativi per un campione statistico sono stati proposti da Karl Pearson; coinvolgono la media (il valore atteso), la mediana, la moda e lo scarto tipo (la radice quadrata della varianza):

  • l'asimmetria di moda di Pearson
( media - moda ) / scarto tipo,
  • il primo coefficiente di asimmetria di Pearson
3 ( media - moda ) / scarto tipo,
  • il secondo coefficiente di asimmetria di Pearson
3 ( media - mediana ) / scarto tipo.

Esempio[modifica | modifica sorgente]

Un esempio di distribuzione non simmetrica con coefficiente di asimmetria 0 è la distribuzione discreta

P(-4)=\tfrac{1}{3},\quad P(1)=\tfrac{1}{2},\quad P(5)=\tfrac{1}{6},

che può essere visualizzata come il lancio di un dado le cui sei facce presentino i numeri " -4, -4, 1, 1, 1, 5 ".

Questa distribuzione è chiaramente non simmetrica, tuttavia ha valore atteso pari a 0 (è centrata) e terzo momento centrale pari a (-64-64+1+1+1+125)/6=0, pertanto ha indici di asimmetria \gamma_1=\beta_1=0.

Nell'esempio la moda e la mediana non coincidono con la media, ma questo si può ottenere aggiungendo altre 4 "facce" con valore 0; in questo modo anche gli indici di Pearson diventano nulli e la distribuzione resta non simmetrica.

Note[modifica | modifica sorgente]

  1. ^ (EN) Paul T. von Hippel, Mean, Median, and Skew: Correcting a Textbook Rule in Journal of Statistics Education. URL consultato il 21 marzo 2010.

Voci correlate[modifica | modifica sorgente]

Altri progetti[modifica | modifica sorgente]

matematica Portale Matematica: accedi alle voci di Wikipedia che trattano di matematica