Coefficiente di correlazione per ranghi di Spearman

Da Wikipedia, l'enciclopedia libera.
Jump to navigation Jump to search
Esempio dove il coefficiente di Spearman è pari a 1. Contrariamente il coefficiente di Pearson non è ottimale.

L'indice di correlazione R per ranghi di Spearman è una misura statistica non parametrica di correlazione. Essa misura il grado di relazione tra due variabili e l'unica ipotesi richiesta è che siano ordinabili, e, se possibile, continue.

Diversamente dal coefficiente di correlazione lineare di Pearson, il coefficiente di Spearman non misura una relazione lineare anche qualora vengano usate misure intervallari. Infatti esso permette di stabilire quanto bene una relazione tra due variabili può essere descritta usando una funzione monotona.

Una generalizzazione del coefficiente di Spearman è utile in situazioni in cui si vuole verificare che le osservazioni avvengano in un particolare ordine, per esempio quando si vuole verificare che i valori migliorano tra un esperimento e l'altro. In tal caso si fa ricorso al test di Page per alternative ordinate sviluppato da E. B. Page.

Storia[modifica | modifica wikitesto]

Il nome del coefficiente prende origine dello psicologo Charles Spearman che lo ideò nel 1904[1]. Viene indicato solitamente con la lettera greca ρs (rho) o anche come rs.

William Sealy Gosset, alias Student, discusse questo coefficiente nel 1921[2].

Calcolo del coefficiente[modifica | modifica wikitesto]

A livello pratico il coefficiente ρ è semplicemente un caso particolare del coefficiente di correlazione di Pearson dove i valori vengono convertiti in ranghi prima di calcolare il coefficiente,

.

anche se solitamente si esegue un calcolo più semplice, in quanto si calcola la differenza D tra i ranghi delle due misure di un'osservazione, ottenendo così

dove

è la differenza dei ranghi (essendo ri e si rispettivamente il rango della prima variabile e della seconda variabile della i-esima osservazione
N il numero complessivo di osservazioni

La formula si complica in presenza di valori identici (ties), ma gli effetti di questi possono essere ignorati se non sono frequenti rispetto alla numerosità campionaria N.

Test di verifica d'ipotesi[modifica | modifica wikitesto]

Per verificare l'ipotesi che ρ è significativamente diverso da zero, il valore osservato di ρ può essere confrontato coi valori critici della variabile casuale di Spearman, consultando le apposite tavole pubblicate per differenti percentuali di significatività.

Nel caso di numerosità campionaria sufficientemente grande (orientativamente N > 20) si può far ricorso alla variabile casuale t di Student (con n-2 gradi di libertà) trasformando opportunamente il valore ρs

Alcuni autori indicano come lievemente peggiore la variabile di test

, distribuita come una variabile casuale normale.

Nel caso si voglia verificare l'ipotesi che ρs abbia un particolare valore diverso da zero, quest'ultima approssimazione che fa ricorso alla t di Student è meno potente, ma ancora valida.

Interpretazione[modifica | modifica wikitesto]

Il segno della correlazione di Spearman indica la direzione dell'associazione tra (la variabile indipendente) e (la variabile dipendente). Se tende ad aumentare quando aumenta, il coefficiente di correlazione di Spearman è positivo. Se tende a diminuire quando aumenta, il coefficiente di correlazione di Spearman è negativo. Una correlazione di Spearman uguale a zero indica che non vi è alcuna tendenza di ad aumentare o diminuire quando aumenta. L'indice di correlazione di Spearman cresce man mano che e si avvicinano all'essere funzioni monotone perfette l'una dell'altra. Quando e sono perfettamente monotonicamente correlati, il coefficiente di correlazione di Spearman è uguale a Una relazione crescente monotona perfetta implica che per due coppie di valori di dati e si ha che e hanno sempre lo stesso segno. Una perfetta relazione decrescente monotona implica che queste differenze hanno sempre segni opposti.

Il coefficiente di correlazione di Spearman è spesso descritto come "non parametrico". Questo può avere due significati. Innanzitutto, una perfetta correlazione di Spearman si ha quando e sono correlati da qualsiasi funzione monotona. In questo differisce con la correlazione di Pearson che fornisce un valore perfetto solo quando e sono correlati da una funzione lineare. L'altro senso in cui il coefficiente di correlazione di Spearman non è parametrico è in quanto la sua esatta distribuzione campionaria può essere ottenuta senza richiedere la conoscenza (dei parametri) della distribuzione di probabilità congiunta di e

Note[modifica | modifica wikitesto]

  1. ^ Spearman C., 1904. The proof and measurement of association between two things. American Journal of Psychology 15: 72–101.
  2. ^ Gosset M. S., 1921. An experimental determination of the probable error of Dr. Spearman's correlation coefficients. Biometrika 13

Altri progetti[modifica | modifica wikitesto]

Collegamenti esterni[modifica | modifica wikitesto]