Carattere (statistica)

Da Wikipedia, l'enciclopedia libera.

In statistica un carattere è il tipo di dati sul quale si concentra uno studio statistico, cioè è una variabile oggetto di studio.

Esempi di caratteri su un campione di persone sono: l'altezza, l'età, il colore degli occhi, il genere, il segno zodiacale, il credo religioso.

Classificazione[modifica | modifica wikitesto]

I caratteri vengono usualmente classificati nella seguente maniera.

  • Un carattere quantitativo esprime una quantità, ovvero le modalità sono dei valori numerici (es. l'altezza o il numero di figli).
    • Un carattere quantitativo discreto o discontinuo assume una quantità finita o numerabile di valori, ovvero i suoi possibili valori possono essere elencati, cioè possono essere indicati con una successione \xi_1,\xi_2,\xi_3,... (es. il numero di figli, le pagine di un libro o i viaggi annuali).
    • Un carattere quantitativo continuo assume una quantità non numerabile ma continua di valori, che cioè possono assumere tutti i valori intermedi di un intervallo (ad esempio l'età, il peso, l'altezza o il reddito).[1]
  • Un carattere qualitativo esprime una qualità, ovvero le modalità sono dei valori non numerici (es. il genere o il credo religioso).
    • Un carattere qualitativo è ordinale (o ordinato o ordinabile) se le modalità posseggono naturalmente un ordine, ovvero possono essere disposte lungo una scala (ad esempio gli attributi "pessimo", "cattivo", "mediocre", "buono" e "ottimo" oppure i giorni della settimana[2]).
    • Un carattere qualitativo è nominale (o sconnesso) se le modalità non posseggono alcun ordine naturale (es. le malattie o il colore degli occhi).

Classificazione alternativa[modifica | modifica wikitesto]

Nel 1946 lo psicologo Stanley Smith Stevens ha proposto una diversa classificazione dei caratteri definendo diverse scale "ammissibili" per le loro modalità classificate in funzione delle proprietà che possiede l'insieme dei valori di un carattere. Stevens ha proposto quattro scale di misura:

  • una scala nominale possiede una relazione di equivalenza, ovvero permette di determinare se due modalità sono uguali o diverse (es. il credo religioso);
  • una scala ordinale possiede una relazione d'ordine totale, ovvero le modalità possono essere ordinate e si può stabilire se una è "maggiore", uguale o "minore" di un'altra (es. il grado militare);
  • una scala intervallare permette di calcolare la differenza tra due valori, quindi anche di ordinarli (es. l'anno dopo Cristo);
  • una scala proporzionale permette di calcolare la proporzione tra due valori, quindi anche la loro differenza[3] (es. l'altezza).

Ognuna di queste scale è un caso particolare della precedente; solitamente per un carattere si adotta la "migliore possibile" tra quelle applicabili.

Ad esempio la temperatura misurata in kelvin segue una scala proporzionale (il rapporto tra due temperature compare ad esempio nella formula per l'efficienza termodinamica di una macchina di Carnot). Se viene invece misurata in gradi Celsius o Fahrenheit allora segue una scala intervallare: la proporzionalità manca a causa della scelta "arbitraria" delle temperature 0 °C e 0 °F.

Per i caratteri qualitativi nominali e ordinali si adotta la scala omonima. Per i caratteri quantitativi non c'è invece corrispondenza tra le due classificazioni discreto/continuo e intervallare/proporzionale.

Classi[modifica | modifica wikitesto]

Le modalità dei caratteri possono essere raggruppate in classi; nel caso di caratteri quantitativi le classi sono sovente intervalli di valori (questo è quanto avviene solitamente approssimando le misurazioni).

Ogni carattere quantitativo continuo può essere reso discreto tramite un'opportuna scelta degli intervalli. Ad esempio l'età espressa in anni ha classi della forma [0,1[,\ [1,2[,\ [2,3[\, ... a cui corrispondono i numeri naturali 0,1,2,.... La scelta degli intervalli è arbitraria, ma deve ovviamente "coprire" tutti i casi possibili senza sovrapposizioni, cioè deve essere una partizione; per questo motivo vengono spesso scelti intervalli della forma [\xi_i,\xi_{i+1}[ o ]\xi_i,\xi_{i+1}], in modo che i valori estremi siano compresi in uno e un solo intervallo.

Grafici[modifica | modifica wikitesto]

Le rappresentazioni grafiche delle frequenze osservate possono essere scelte in funzione del tipo di carattere considerato.

Ad esempio su un istogramma possibile rappresentare valori in scala, o in intervalli, quindi può contenere più informazioni riguardo ad una variabile quantitativa rispetto ad un diagramma circolare.

Note[modifica | modifica wikitesto]

  1. ^ In questa categoria ricadono anche caratteri i cui valori sono discreti ma possono essere determinati con una precisione molto alta e vengono "considerati" continui.
  2. ^ Tra i sette giorni della settimana il "primo" è convenzionalmente lunedì in Italia e domenica nel Regno Unito.
  3. ^ Rispetto a un fissato valore che viene scelto come unità di misura.

Bibliografia[modifica | modifica wikitesto]

Voci correlate[modifica | modifica wikitesto]