Tabella di contingenza

Da Wikipedia, l'enciclopedia libera.

Le tabelle di contingenza sono un particolare tipo di tabelle a doppia entrata (cioè tabelle con etichette di riga e di colonna), utilizzate in statistica per rappresentare e analizzare le relazioni tra due o più variabili. In esse si riportano le frequenze congiunte delle variabili.

Il caso più semplice è quello delle tabelle tetracoriche, in cui ciascuna delle due variabili assume solo due possibili valori, ad esempio:

Colore degli occhi\Colore dei capelli
21 19 40
9 51 60
30 70 100

Dove, tra le 100 persone esaminate, 30 presentano capelli biondi, 40 occhi chiari e soltanto 21 hanno capelli biondi e occhi chiari. Da questi dati è possibile ricavare i dati restanti della tabella. Utilizzando le tabelle di contingenza e operando specifici calcoli su di esse, si può arrivare a determinare la dipendenza o indipendenza tra le due variabili considerate, in base al valore assunto dall'indice di contingenza quadratico .

Le due variabili considerate sono di tipo quantitativo discreto o qualitativo. Indicando tali variabili con X e Y e rispettivamente con (i = 1,2,…,h) e (j=1,2,…,k) le modalità rilevate per le due variabili, a ogni coppia (, ) si fa corrispondere nella tabella la sua frequenza associata , cioè il numero di elementi, tra gli n della popolazione, che possiedono contemporaneamente la modalità di di X e di Y.

X\Y

dove

  • (i = 1,2,…,h) rappresenta le frequenze marginali assolute di X
  • (j = 1,2,…,k) rappresenta le frequenze marginali assolute di Y

Ovviamente, sommando tutte le frequenze assolute presenti nella tabella, troveremo la numerosità n della popolazione:

Dalle frequenze assolute si ottengono le frequenze relative calcolando:

X\Y

Altri progetti[modifica | modifica wikitesto]

Matematica Portale Matematica: accedi alle voci di Wikipedia che trattano di matematica