Scarto quadratico medio

Da Wikipedia, l'enciclopedia libera.
(Reindirizzamento da Standard deviation)

Lo scarto quadratico medio (o deviazione standard o scarto tipo[1]) è un indice di dispersione statistico, vale a dire una stima della variabilità di una popolazione di dati o di una variabile casuale.

Lo scarto quadratico medio è uno dei modi per esprimere la dispersione dei dati intorno ad un indice di posizione, quale può essere, ad esempio, la media aritmetica o una sua stima. Ha pertanto la stessa unità di misura dei valori osservati (al contrario della varianza che ha come unità di misura il quadrato dell'unità di misura dei valori di riferimento). In statistica la precisione si può esprimere come lo scarto quadratico medio.

Una serie di dati con una media di 50 (in blu) e uno scarto quadratico medio (σ) di 20.

Il termine "standard deviation" è stato introdotto in statistica da Pearson[2] nel 1894 assieme alla lettera greca (sigma) che lo rappresenta. Il termine italiano "deviazione standard" ne è la traduzione più utilizzata nel linguaggio comune; il termine dell'Ente Nazionale Italiano di Unificazione è tuttavia "scarto tipo", definito come la radice quadrata positiva della varianza per lo meno fin dal 1984[3].

Se non indicato diversamente, lo scarto quadratico medio è la radice quadrata della varianza,[4] la quale viene coerentemente rappresentata con il quadrato di sigma ().

Statistica[modifica | modifica wikitesto]

In statistica lo scarto quadratico medio di un carattere rilevato su una popolazione di unità statistiche si definisce esplicitamente come:[5]

dove è la media aritmetica di .

Formalmente lo scarto quadratico medio di una variabile può essere calcolata a partire dalla funzione generatrice dei momenti, in particolare è la radice quadrata della differenza tra il momento secondo ed il momento primo elevato al quadrato.

A partire dallo scarto quadratico medio si definisce anche il coefficiente di variazione[6] o la deviazione standard relativa come il rapporto tra lo scarto tipo e il valore assoluto della media aritmetica della variabile in esame:

Questo indice relativo (che viene spesso espresso in termini percentuali[7]) consente di effettuare confronti tra dispersioni di dati di tipo diverso, indipendentemente dalle loro quantità assolute.

Deviazione standard corretta[modifica | modifica wikitesto]

Nell'ambito della statistica inferenziale (dove è noto solo un campione della popolazione), soprattutto nell'ambito della teoria della stima, a volte si rimpiazza il denominatore con ottenendo:

Sostanzialmente, poiché non è nota la media dell'intera popolazione, ma solo una sua stima (la media del campione), bisogna utilizzare per ottenere uno stimatore corretto della varianza incognita di sull'intera popolazione a partire dai dati del campione. La sua radice quadrata diviene lo scarto quadratico medio "corretto".

Questa correzione al denominatore fa sì che la nuova definizione sia un po' più grande della precedente, correggendo così la tendenza della precedente a sottostimare le incertezze soprattutto nel caso in cui si lavori con pochi dati ( piccolo).

Osserviamo il caso limite di , cioè quando si ha un campione di un solo elemento: la prima definizione dà il risultato , che ovviamente non è molto ragionevole nell'ambito della statistica inferenziale, mentre quella "corretta" dà un risultato non definito del tipo , rispecchiando così la totale ignoranza inerente all'incertezza su una singola misura. In questo senso, si dice che la statistica non dice nulla sul singolo caso.

Peraltro la differenza tra le due definizioni è spesso numericamente insignificante.

Semplificando la formula[modifica | modifica wikitesto]

Il calcolo può essere semplificato come segue:

cioè, applicando il tutto alla formula originale:

Probabilità[modifica | modifica wikitesto]

Sia una variabile aleatoria, lo scarto quadratico medio è definito come la radice quadrata della varianza di

Formalmente lo scarto quadratico medio di una variabile aleatoria può essere calcolato a partire dalla funzione generatrice dei momenti, in particolare è la radice quadrata della differenza tra il momento secondo ed il momento primo elevato al quadrato, cioè

dove è il valore atteso di .

Applicazioni[modifica | modifica wikitesto]

In ambito finanziario, lo scarto quadratico medio viene usato per indicare la variabilità di un'attività finanziaria e dei suoi payoff (rendimenti). Esso fornisce quindi, implicitamente, una misura della volatilità dell'attività, quindi del suo rischio.

Nell'ambito del Capital Asset Pricing Model, fornendo un'idea della misura di rischio, esso determina univocamente il prezzo sul mercato.[è sbagliato parlare di prezzo determinato dallo scarto quadratico medio. Secondo il CAPM una security con beta negativo o nullo ha un rendimento atteso(quindi un prezzo) inferiore a quello relativo del mercato a prescindere dallo scarto quadratico medio. Il prezzo è quindi una funzione della correlazione con il mercato, non tanto dello scarto quadratico medio.]

In fisica, è un ottimo indice dell'errore casuale della misurazione di una grandezza fisica.

In ambito sportivo è utilizzato per valutare la prestazione di un giocatore di bowling in riferimento ad un certo numero di partite. Il valore trovato non incide sul punteggio ma sintetizza le capacità e i miglioramenti del giocatore.

In ingegneria, è uno dei parametri da considerare per valutare la capacità di un processo produttivo.

Nelle applicazioni informatiche, è a volte conveniente utilizzare la formula

che consente, con sole quattro variabili , di calcolare lo scarto quadratico medio (oltre che la media) di un flusso di numeri di lunghezza imprecisata, senza dover ricorrere ad una memorizzazione degli stessi.

Note[modifica | modifica wikitesto]

  1. ^ UNI Norma italiana UNI ISO 3534-1:2000 Statistica - Vocabolario e simboli, Probabilità e termini statistici generali. Milano: UNI, 2000, definizione 1.23.
  2. ^ Karl Pearson, On the dissection of asymmetrical frequency curves, 1894
  3. ^ UNI, Norma italiana UNI 4723:1984, Metodi statistici per il controllo della qualità. Termini, simboli e definizioni. Milano: UNI, 1984. sostituita dalla norma citata UNI ISO 3534-1 nel febbraio 2000.
  4. ^ Glossario Istat
  5. ^ Sheldon, p. 96.
  6. ^ UNI, Norma italiana UNI ISO 3534-1:2000, Statistica - Vocabolario e simboli, Probabilità e termini statistici generali. Milano: UNI, 2000, definizione 1.24 e 2.35.
  7. ^ Domenico Piccolo, Statistica, Il Mulino, Bologna, 1998, p. 123.

Bibliografia[modifica | modifica wikitesto]

Voci correlate[modifica | modifica wikitesto]

Altri progetti[modifica | modifica wikitesto]

Collegamenti esterni[modifica | modifica wikitesto]

Controllo di autorità GND: (DE4767332-1