Q di Yule
La variabile di test Q di Yule è un indice di associazione, ideato dallo statistico scozzese George Udny Yule, e usato in tabelle statistiche dette di contingenza .
Un indicatore ideato dallo stesso autore è la Y di Yule. Rispetto quest'ultima il valore assoluto è sempre maggiore () a meno che non vi sia indipendenza o completa associazione.
Storia
[modifica | modifica wikitesto]L'indice venne presentato da Yule nell'articolo On the association of attributes in statistics[1] e fu al centro di una controversia con il matematico e statistico inglese Karl Pearson. La posizione di Pearson era che alla base di una tabella di contingenza vi fosse un fenomeno continuo e gaussiano, invece che un fenomeno discreto come sostenuto da Yule, che considerava poco scientifico fare ipotesi non desiderate e non verificabili.
Pearson, inoltre, notava che "collassando" una tabella , riducendola a 2x2, si ottengono risultati differenti a seconda di come vengono aggregati i valori.
Questa osservazione rimane tuttora valida.
Metodologia
[modifica | modifica wikitesto]ove
- è il cosiddetto odds ratio
- ove sia che assumono i valori 1 e 2
Tale indice varia tra -1 e +1, ove 0 indica l'indipendenza.
può essere stimato da
dove in questo caso
- in analogia a (con il vincolo che sia sempre maggiore di zero
mentre la varianza di viene stimata con
Esempio
[modifica | modifica wikitesto]Valori assoluti +-------------+-------+------+ | \ Abile | Si | No | |Sesso \ | | | +-------------+-------+------+ |Uomini | 20 | 80 | |Donne | 90 | 80 | +-------------+-------+------+ Valori relativi (f) +-------------+-------+------+ | \ Abile | Si | No | |Sesso \ | | | +-------------+-------+------+ |Uomini | 0,074 | 0,296| |Donne | 0,333 | 0,296| +-------------+-------+------+
Valori di q differenti
[modifica | modifica wikitesto]Collassando una tabella a una , a causa del criterio di aggregazione dei valori, si possono ottenere valori di differenti. (cf. osservazione di Karl Pearson)
Se per esempio i dati di partenza fossero stati
+-------------+-------+------+------+ | \ Abile | Si | boh! | No | |Sesso \ | | | | +-------------+-------+------+------+ |Uomini | 20 | 10 | 70 | |Donne | 90 | 0 | 80 | +-------------+-------+------+------+
assegnando il "Boh!" ai "No" si ottiene la tabella e il di cui sopra, mentre assegnandolo ai "Si" si ottiene la tabella seguente:
+-------------+-------+------+ | \ Abile | Si | No | |Sesso \ | | | +-------------+-------+------+ |Uomini | 30 | 70 | |Donne | 90 | 80 | +-------------+-------+------+
con l'indicatore che si attenua diventando
Note
[modifica | modifica wikitesto]- ^ Georg Undy Yule, On the association of attributes in statistics, in Philosophical Transactions of the Royal Society of London, Londra, 1900.