Tabella di contingenza

Da Wikipedia, l'enciclopedia libera.

Le tabelle di contingenza sono un particolare tipo di tabelle a doppia entrata (cioè tabelle con etichette di riga e di colonna), utilizzate in statistica per rappresentare e analizzare le relazioni tra due o più variabili. In esse si riportano le frequenze congiunte delle variabili.

Il caso più semplice è quello delle tabelle tetracoriche, in cui ciascuna delle due variabili assume solo due possibili valori, ad esempio:

Colore degli occhi\Colore dei Capelli Biondi  Non Biondi Totale
Chiari 21 19 40
Non Chiari 9 51 60
Totale 30 70 100

Dove, tra le 100 persone esaminate, 30 presentano capelli biondi, 40 occhi chiari e soltanto 21 hanno capelli biondi e occhi chiari. Da questi dati è possibile ricavare i dati restanti della tabella. Utilizzando le tabelle di contingenza e operando specifici calcoli su di esse, si può arrivare a determinare la dipendenza o indipendenza tra le due variabili considerate, in base al valore assunto dall’indice di contingenza quadratico  X^2 .

Le due variabili considerate sono di tipo quantitativo discreto o qualitativo. Indicando tali variabili con X e Y e rispettivamente con  x_i (i = 1,2,…,h) e  y_j (j=1,2,…,k) le modalità rilevate per le due variabili, ad ogni coppia ( x_i , y_j ) si fa corrispondere nella tabella la sua frequenza associata  n_{i,j} , cioè il numero di elementi, tra gli n della popolazione, che possiedono contemporaneamente la modalità di  x_i di X e  y_j di Y.

X\Y y_1 y_2 ... y_j ... y_k Totale
x_1 n_{1,1} n_{1,2} ... n_{1,j} ... n_{1,k} n_{1,.}
x_2 n_{2,1} n_{2,2} ... n_{2,j} ... n_{2,k} n_{2,.}
... ... ... ... ... ... ... ...
x_i n_{i,1} n_{i,2} ... n_{i,j} ... n_{i,k} n_{i,.}
... ... ... ... ... ... ... ...
x_h n_{h,1} n_{h,2} ... n_{h,j} ... n_{h,k} n_{h,.}
Totale n_{.,1} n_{.,2} ... n_{.,j} ... n_{.,k} n

dove

  • n_{i,.} = \sum_{j=1}^k n_{i,j} (i = 1,2,…,h) rappresenta le frequenze marginali assolute di X
  • n_{.,j} = \sum_{i=1}^h n_{i,j} (j = 1,2,…,k) rappresenta le frequenze marginali assolute di Y

Ovviamente, sommando tutte le frequenze assolute presenti nella tabella, troveremo la numerosità n della popolazione:

\sum_{i=1}^h \sum_{j=1}^k n_{i,j} = \sum_{i=1}^h n_{i,.} = \sum_{j=1}^k n_{.,j} = n

Dalle frequenze assolute n_{i,j} si ottengono le frequenze relative f_{i,j} calcolando:

f_{i,j} = \left(\frac{n_{i,j}}{n}\right)

X\Y y_1 y_2 ... y_j ... y_k Totale
x_1 f_{1,1} f_{1,2} ... f_{1,j} ... f_{1,k} f_{1,.}
x_2 f_{2,1} f_{2,2} ... f_{2,j} ... f_{2,k} f_{2,.}
... ... ... ... ... ... ... ...
x_i f_{i,1} f_{i,2} ... f_{i,j} ... f_{i,k} f_{i,.}
... ... ... ... ... ... ... ...
x_h f_{h,1} f_{h,2} ... f_{h,j} ... f_{h,k} f_{h,.}
Totale f_{.,1} f_{.,2} ... f_{.,j} ... f_{.,k} 1
matematica Portale Matematica: accedi alle voci di Wikipedia che trattano di matematica