Media (statistica)

Da Wikipedia, l'enciclopedia libera.
Una funzione di distribuzione con evidenziate la moda, la mediana e la media

In statistica la media è un singolo valore numerico che descrive sinteticamente un insieme di dati. Esistono varie tipologie di media che possono essere scelte per descrivere un fenomeno. Quelle più comunemente impiegate sono le tre medie pitagoriche (aritmetica, geometrica, e armonica).

Nel linguaggio ordinario spesso viene chiamato media il tipo che è detto media aritmetica, sottintendendo quindi il termine aritmetica.

Indice

Media aritmetica [modifica]

La media aritmetica è il tipo di media impiegato più comunemente e quello al quale, con il termine "media", si fa in genere riferimento nel parlare comune. Viene usata per riassumere con un solo numero un insieme di dati su un fenomeno misurabile (per esempio, l'altezza media di una popolazione).

Viene calcolata sommando i diversi valori a disposizione, i quali vengono divisi per il loro numero complessivo.

La formula della media aritmetica semplice per n elementi è:[1]

M_a=\frac{1}{n}\sum_{i=1}^n x_i

La media aritmetica ponderata (o media pesata) è una combinazione lineare convessa dei dati in analisi. Ciascun valore è moltiplicato per il proprio peso.

La formula generale è:

M_{a,pond}=\frac{\sum_{i=1}^n x_i f_i}{\sum_{i=1}^n f_i}

dove f rappresenta il peso di ciascun termine.

Si dimostra facilmente che la media aritmetica è un indice di posizione, in quanto aggiungendo o moltiplicando tutti i valori per una stessa quantità la media stessa aumenta o è moltiplicata per quella stessa quantità. Come tutti gli indici di posizione, la media aritmetica fornisce l'ordine di grandezza dei valori esistenti e permette di conoscerne la somma dei valori (moltiplicando la media per il numero n di elementi).

Oltre che in matematica, la media aritmetica è ampiamente impiegata in svariati campi, quali economia, sociologia e nella maggior parte delle discipline accademiche.

Nonostante la media aritmetica sia spesso usata per fare riferimento alle tendenze, non fornisce un dato statistico robusto in quanto risente notevolmente dei valori outlier. Nelle distribuzioni simmetriche la media aritmetica può non accordarsi con il valore medio e altri indici più forti, come la mediana, forniscono una migliore descrizione della tendenza centrale.

Esempio [modifica]

Dati cinque numeri:

x_1=10 \quad x_2=13 \quad x_3=9 \quad x_4=7 \quad x_5=12

la loro media aritmetica è data da:

M_a = \frac{1}{5}\sum_{i=1}^{5}x_i = \frac{51}{5} = 10{,}2

Media ponderata [modifica]

Per calcolare la media ponderata di una serie di dati di cui ogni elemento x_i proviene da una differente distribuzione di probabilità con una varianza {\sigma_i}^2 nota, una possibile scelta per i pesi è data da:

w_i = \frac{1}{\sigma_i^2}

La media ponderata in questo caso è:

\bar{x} = \frac{ \sum_{i=1}^n x_i/{\sigma_i}^2}{\sum_{i=1}^n 1/{\sigma_i}^2}

e la varianza della media ponderata è:

\sigma_{\bar{x}}^2 = \frac{ 1 }{\sum_{i=1}^n 1/{\sigma_i}^2}

che si riduce a  \sigma_{\bar{x}}^2 = \frac{ {\sigma_0}^2 }{n} quando tutti i \sigma_i = \sigma_0.

Il significato di tale scelta è che questa media pesata è lo stimatore di massima verosimiglianza della media delle distribuzioni di probabilità nell'ipotesi che esse siano indipendenti e normalmente distribuite con la stessa media.

Media geometrica [modifica]

La media geometrica di n termini è la radice n-esima del prodotto degli n valori:

M_g = \sqrt[n]{\prod_{i=1}^n x_i}

Sfruttando le proprietà dei logaritmi, l'espressione della media geometrica può essere resa trasformando i prodotti in somme e le potenze in prodotti:

\sqrt[n]{\prod_{i=1}^n x_i} = \exp\left[\frac1n\sum_{i=1}^n\ln x_i\right]

Analogamente al caso della media aritmetica, attribuendo un peso ai termini si può calcolare la media geometrica ponderata:

\ M_{g,pond} = \sqrt[\left(\sum_{i=1}^n f_i\right)]{\prod_{i=1}^n x_i^{f_i}}

La media geometrica può essere vista anche come media aritmetico-armonica. Definendo infatti due successioni:

a_{n+1} = \frac{a_n + h_n}{2}, \quad a_0=x
h_{n+1} = \frac{2}{\frac{1}{a_n} + \frac{1}{h_n}}, \quad h_0=y

a_n e h_n convergono alla media geometrica di x e y

Infatti le successioni convergono ad un limite comune. Si può infatti osservare che:

\sqrt{a_ih_i}=\sqrt{\frac{a_i+h_i}{\frac{a_i+h_i}{h_ia_i}}}=\sqrt{\frac{a_i+h_i}{\frac{1}{a_i}+\frac{1}{h_i}}}=\sqrt{a_{i+1}h_{i+1}}

Lo stesso ragionamento può essere applicato sostituendo le medie aritmetica e armonica con una coppia di medie generalizzate di ordine finito ed opposto.

La media geometrica si applica a valori positivi. Ha un chiaro significato geometrico: ad esempio la media geometrica di due numeri è la lunghezza del lato di un quadrato equivalente ad un rettangolo che abbia i lati di modulo pari ai due numeri. Lo stesso vale in un numero di dimensioni superiore. La media geometrica trova impiego soprattutto dove i valori considerati vengono per loro natura moltiplicati tra di loro e non sommati. Esempio tipico sono i tassi di crescita, come i tassi d'interesse o i tassi d'inflazione.

Una caratteristica è che valori piccoli (rispetto alla media aritmetica) sono molto più influenti dei valori grandi. In particolare, è sufficiente la presenza di un unico valore nullo per annullare la media.

Esempio [modifica]

Dati cinque numeri:

x_1=10 \quad x_2=13 \quad x_3=9 \quad x_4=7 \quad x_5=12

la loro media geometrica è data da:

M_g = \sqrt[5]{\prod_{i=1}^5 x_i} = \sqrt[5]{10 \cdot 13 \cdot 9 \cdot 7 \cdot 12 } = \sqrt[5]{98\,280} \approx 9{,}97

Media armonica [modifica]

La media armonica di n termini è definita come il reciproco della media aritmetica dei reciproci.

M_h = \frac {n} {\sum_{i=1}^n \frac{1} {x_i}}

Per praticità di calcolo si può applicare la seguente formula, ottenuta tramite le proprietà di somme e prodotti:

M_h = \frac{n \cdot \prod_{i=1}^n x_i }{ \sum_{j=1}^n \frac{\prod_{i=1}^n x_i}{x_j}}

Se a un insieme di dati è associato un insieme di pesi w_1 \dots w_n, è possibile definire la media armonica ponderata come:

\frac{\sum_{i=1}^n w_i }{ \sum_{i=1}^n \frac{w_i}{x_i}}

La media armonica semplice rappresenta un caso particolare, nel quale tutti i pesi hanno valore unitario.

La media armonica è fortemente influenzata dagli elementi di modulo minore: rispetto alla media aritmetica risente meno dell'influenza di outlier grandi, ma è influenzata notevolmente dagli outlier piccoli.

Esempio [modifica]

Dati cinque numeri:

x_1=10 \quad x_2=13 \quad x_3=9 \quad x_4=7 \quad x_5=12

la loro media armonica è data da:

M_h = \frac {5} {\sum_{i=1}^5 \frac{1} {x_i}} \approx \frac {5} {0{,}51} \approx 9{,}72

Media di potenza [modifica]

La media di potenza (o media generalizzata o media di Hölder o media p-esima) rappresenta una generalizzazione delle medie pitagoriche. È definita come la radice p-esima della media aritmetica delle potenze di esponente p degli n valori considerati:

M_p(x_1,\dots,x_n) = \sqrt[p]{\frac{1}{n}\sum_{i=1}^n x_i^p}

Molte altre tipologie di media sono casi particolari della media generalizzata, per opportuni valori di p:

  • media aritmetica, per p=1
  • media geometrica, per p\rightarrow0
  • media armonica, per p=-1
  • media quadratica, per p=2 (usata soprattutto in presenza di numeri negativi per eliminare i segni)
  • media cubica, per p=3

Inoltre:

  • M_{+\infty}(x_1,\dots,x_n) = \max\{x_1,\ldots,x_n\}
  • M_{-\infty}(x_1,\dots,x_n) = \min\{x_1,\ldots,x_n\}

Ad ogni termine può essere associato un coefficiente detto peso, in genere rappresentato dalla frequenza oppure da un valore il quale descrive l'importanza (oggettiva o soggettiva) che il singolo elemento riveste nella distribuzione. Se ai dati in esame si assegna un insieme di pesi w_i, tali che w=\sum w_i, è possibile definire la media pesata:

M_p(x_1,\dots,x_n) = \sqrt[p]{\frac{1}{w}\sum_{i=1}^n w_ix_{i}^p}

Media aritmetico-geometrica [modifica]

La media aritmetico-geometrica (AGM) di due numeri reali positivi x e y è definita come limite comune di due successioni definite come segue.

Si determinano la media aritmetica a_1 e la media geometrica g_1 di x ed y

a_1 = \tfrac{1}{2}(x + y)
g_1 = \sqrt{xy}.

Quindi si itera il procedimento, sostituendo a_1 ad x e g_1 ad y. In questo modo si ottengono due successioni:

a_{n+1} = \tfrac{1}{2}(a_n + g_n)
g_{n+1} = \sqrt{a_n g_n}

Le due successioni sono convergenti e hanno limite comune, detto media aritmetico-geometrica di x ed y, indicata come \Mu(x,y) o talvolta come agm(x,y).

La media geometrica di due numeri è sempre minore della media aritmetica, di conseguenza g_n è una successione crescente, a_n è decrescente e si ha g_n \leq \Mu(x,y) \leq a_n (le disuguaglianze sono strette se xy).

Quindi \Mu(x,y) è un numero compreso fra la media aritmetica e la media geometrica di x ed y.

Inoltre, dato un numero reale r ≥ 0, vale la relazione

\Mu(rx, ry) = r\Mu(x,y)

Esiste anche una espressione in forma integrale di \mu(x,y):

\Mu(x,y) = \frac{\pi}{4} (x + y) \; / \; K\!\left[\left( \frac{x - y}{x + y} \right)^2 \right]

dove \Kappa(m) rappresenta l'integrale ellittico completo di prima specie:

K(m)=\int_0^{\frac{\pi}{2}}\frac{d\theta}{\sqrt{1-m \, \mathrm{sen}^2(\theta)}}

Inoltre, poiché la media aritmetico-geometrica converge piuttosto rapidamente, la formula precedente è utile anche nel calcolo degli integrali ellittici.

Il reciproco della media aritmetico-geometrica di 1 e \sqrt{2} è chiamata costante di Gauss, in onore del matematico tedesco Carl Friedrich Gauss.

 \frac{1}{\Mu(1, \sqrt{2})} = G = 0{,}8346268\dots

Media integrale [modifica]

Una generalizzazione del concetto di media a distribuzioni continue prevede l'uso di integrali. Supponiamo di avere una funzione f: [a,b]\rightarrow  \Bbb{R}, integrabile. Allora si può definire la media \mu come:

 \mu = \frac{1}{b-a}\int_{a}^b f(x)dx

Data inoltre una funzione p: [a,b]\rightarrow  \Bbb{R} tale che p(x)\!>\!0, detta peso, si può definire la media integrale pesata \mu_p come:

 \mu_p = \frac{\int_{a}^b p(x)f(x)dx}{\int_{a}^b p(x)dx}

Più in generale data una funzione f: \Omega \rightarrow \Bbb{R} dove \Omega è un insieme sul quale è definita una funzione di integrazione, si definisce la media \mu come:

\mu =\frac{\int_\Omega f(x) dx}{\int_\Omega dx}

Media temporale [modifica]

La media temporale, spesso usata nella trattazione di segnali, è chiamata componente continua. Si tratta della media integrale calcolata in un intervallo di tempo tendente all'infinito.

 \langle x\rangle_{(t_2,t_1)} = \frac{1}{t_2-t_1}\int_{t_1}^{t_2} x(t)dt.

per: t_2 - t_1 = T_0 \rightarrow  \infty

Note [modifica]

  1. ^ (EN) IUPAC Gold Book, "arithmetic mean (average)"

Voci correlate [modifica]

Collegamenti esterni [modifica]

  • Calcolo della media pesata - Sito italiano che permette di eseguire online il calcolo della media, anche pesata, di una serie di dati.
  • Calcolo Media Ponderata - Sito italiano che permette di calcolare la media ponderata on-line. In specifico per l'Università.