Correlazione (statistica)

Da Wikipedia, l'enciclopedia libera.
Jump to navigation Jump to search
Esempi di insiemi di punti (x;y) con relativo coefficiente di correlazione.

In statistica, una correlazione è una relazione tra due variabili tale che a ciascun valore della prima corrisponda, con una certa regolarità, un valore della seconda.[1][2]

Definizione[modifica | modifica wikitesto]

Contrariamente a quanto si potrebbe intuire, la correlazione non dipende da un rapporto di causa-effetto quanto dalla tendenza di una variabile a cambiare in funzione di un'altra.[3] Le variabili possono essere tra loro dipendenti (per esempio la relazione tra stature dei padri e dei figli) oppure comuni (relazione tra altezza e peso di una persona).[4]

Nel cercare una correlazione statistica tra due grandezze, per determinare un possibile rapporto di causa-effetto, essa non deve risultare una correlazione spuria.[5]

Cenni storici[modifica | modifica wikitesto]

Il termine apparve per la prima volta in un'opera di Francis Galton, "Hereditary Genius" (1869).[6] Non fu definita in modo più approfondito (la moralità di un individuo e la sua instabilità morale sono non correlate).[7]

Otto anni dopo, nel 1877, lo stesso Galton scoprì che i coefficienti di regressione lineare tra X e Y sono gli stessi se - ad entrambe le variabili - viene applicata la deviazione standard σx e σy: Galton utilizzò in realtà lo scarto interquartile, definendo il parametro "coefficiente di co-relazione" e abbreviando "regressione" in r.[8]

Descrizione[modifica | modifica wikitesto]

In base alle caratteristiche presentate, la correlazione può definirsi:

  • diretta (o positiva): la variazione di un elemento interessa - in via diretta - anche l'altro. Per esempio, alle stature alte dei padri corrispondono stature alte dei figli;
  • indiretta (anche inversa o negativa): alla variazione di un elemento corrisponde, in senso contrario, quella dell'altro. Ad esempio, ad una maggior produzione di grano corrisponde un prezzo minore.

Inoltre, le correlazioni possono essere:

  • semplici: mettono in relazione due fenomeni, per esempio il numero di matrimoni e la quantità di nascite;
  • doppie: se i fenomeni posti in relazione sono tre, come la circolazione monetaria, i prezzi e il risparmio;
  • triple: quando pongono in relazione tra loro quattro elementi.

Il grado di correlazione tra due variabili viene espresso tramite l'indice di correlazione.[9] Il valore che esso assume è compreso tra −1 (correlazione inversa) e 1 (correlazione diretta e assoluta), con un indice pari a 0 che comporta l'assenza di correlazione; il valore nullo dell'indice non implica, tuttavia, che le variabili siano indipendenti.

I coefficienti di correlazione sono derivati dagli indici, tenendo presenti le grandezze degli scostamenti dalla media. In particolare, l'indice di correlazione di Pearson è calcolato come rapporto tra la covarianza delle due variabili e il prodotto delle loro deviazioni standard.[10]:

Va comunque notato che gli indici e i coefficienti di correlazione siano da ritenersi sempre approssimativi, a causa dell'arbitrarietà con cui sono scelti gli elementi: ciò è vero, in particolare, nei casi di correlazioni multiple.[11]

Note[modifica | modifica wikitesto]

  1. ^ Definizione di correlazione, su dizionari.corriere.it. URL consultato l'8 ottobre 2017.
  2. ^ Paolo Enriques, Filippo Bottazzi e Giorgio Mortara, CORRELAZIONE, su treccani.it, 1931.
  3. ^ Il concetto di correlazione (PDF), su pellerey.unisal.it. URL consultato il 22 gennaio 2018.
  4. ^ Analisi di correlazione (PDF), su sisdin.unipv.it. URL consultato il 26 novembre 2017.
  5. ^ Correlazione, su albanesi.it. URL consultato il 2 giugno 2018.
  6. ^ La nascita del concetto di correlazione (PDF), su padis.uniroma1.it. URL consultato il 23 gennaio 2018.
  7. ^ (EN) Francis Galton's account of the invention of correlation, su jstor.org, maggio 1989.
  8. ^ Regressione, su treccani.it. URL consultato il 18 giugno 2018.
  9. ^ Indice di correlazione, su alcula.com.
  10. ^ Dove si semplificano i fattori a numeratore e denominatore.
  11. ^ Coefficiente (o indice) di correlazione, su studenti.it, 7 marzo 2015.

Voci correlate[modifica | modifica wikitesto]

Altri progetti[modifica | modifica wikitesto]

Collegamenti esterni[modifica | modifica wikitesto]

Controllo di autoritàGND (DE4165343-9
Statistica Portale Statistica: accedi alle voci di Wikipedia che trattano di statistica