Q di Yule

Da Wikipedia, l'enciclopedia libera.
Vai alla navigazione Vai alla ricerca

La variabile di test Q di Yule è un indice di associazione, ideato dallo statistico scozzese George Udny Yule, e usato in tabelle statistiche dette di contingenza .

Un indicatore ideato dallo stesso autore è la Y di Yule. Rispetto quest'ultima il valore assoluto è sempre maggiore () a meno che non vi sia indipendenza o completa associazione.

Storia[modifica | modifica wikitesto]

L'indice venne presentato da Yule nell'articolo On the association of attributes in statistics[1] e fu al centro di una controversia con il matematico e statistico inglese Karl Pearson. La posizione di Pearson era che alla base di una tabella di contingenza vi fosse un fenomeno continuo e gaussiano, invece che un fenomeno discreto come sostenuto da Yule, che considerava poco scientifico fare ipotesi non desiderate e non verificabili.

Pearson, inoltre, notava che "collassando" una tabella , riducendola a 2x2, si ottengono risultati differenti a seconda di come vengono aggregati i valori.
Questa osservazione rimane tuttora valida.

Metodologia[modifica | modifica wikitesto]

ove

è il cosiddetto odds ratio
ove sia che assumono i valori 1 e 2

Tale indice varia tra -1 e +1, ove 0 indica l'indipendenza.

può essere stimato da

dove in questo caso

in analogia a (con il vincolo che sia sempre maggiore di zero

mentre la varianza di viene stimata con

Esempio[modifica | modifica wikitesto]

 Valori assoluti
 +-------------+-------+------+
 |     \ Abile |   Si  |  No  |
 |Sesso \      |       |      |
 +-------------+-------+------+
 |Uomini       |  20   |  80  |
 |Donne        |  90   |  80  |
 +-------------+-------+------+

 Valori relativi (f)
 +-------------+-------+------+
 |     \ Abile |   Si  |  No  |
 |Sesso \      |       |      |
 +-------------+-------+------+
 |Uomini       | 0,074 | 0,296|
 |Donne        | 0,333 | 0,296|
 +-------------+-------+------+

Valori di q differenti[modifica | modifica wikitesto]

Collassando una tabella a una , a causa del criterio di aggregazione dei valori, si possono ottenere valori di differenti. (cf. osservazione di Karl Pearson)

Se per esempio i dati di partenza fossero stati

 
 +-------------+-------+------+------+
 |     \ Abile |   Si  | boh! |  No  |
 |Sesso \      |       |      |      |
 +-------------+-------+------+------+
 |Uomini       |  20   |  10  |  70  |
 |Donne        |  90   |   0  |  80  |
 +-------------+-------+------+------+

assegnando il "Boh!" ai "No" si ottiene la tabella e il di cui sopra, mentre assegnandolo ai "Si" si ottiene la tabella seguente:

 +-------------+-------+------+
 |     \ Abile |   Si  |  No  |
 |Sesso \      |       |      |
 +-------------+-------+------+
 |Uomini       |  30   |  70  |
 |Donne        |  90   |  80  |
 +-------------+-------+------+

con l'indicatore che si attenua diventando

Note[modifica | modifica wikitesto]

  1. ^ Georg Undy Yule, On the association of attributes in statistics, in Philosophical Transactions of the Royal Society of London, Londra, 1900.
  Portale Economia: accedi alle voci di Wikipedia che trattano di economia