Carattere (statistica)
In statistica un carattere è il tipo di dati sul quale si concentra uno studio statistico.
Esempi di caratteri su un campione di persone sono: l'altezza, l'età, il colore degli occhi, il genere, il segno zodiacale, il credo religioso.
Indice |
[modifica] Classificazione
I caratteri vengono usualmente classificati nella seguente maniera.
- Un carattere quantitativo esprime una quantità, ovvero dei valori numerici (l'altezza o il numero di figli).
- Un carattere quantitativo discreto assume una quantità finita o numerabile di valori, ovvero i suoi possibili valori possono essere indicati
(il numero di figli o gli anni di età). - Un carattere quantitativo continuo assume una quantità non numerabile ma continua di valori, che cioè possono assumere tutti i valori intermedi di un intervallo (ad esempio, il peso).[1]
- Un carattere quantitativo discreto assume una quantità finita o numerabile di valori, ovvero i suoi possibili valori possono essere indicati
- Un carattere qualitativo esprime una qualità, ovvero dei valori non numerici (il genere o il credo religioso).
- Un carattere qualitativo ordinale (o ordinato o ordinabile) assume valori che posseggono naturalmente un ordine, ovvero che possono essere disposti lungo una scala (gli attributi "pessimo", "cattivo", "mediocre", "buono" e "ottimo").
- Un carattere qualitativo nominale (o sconnesso) assume valori che non posseggono alcun ordine naturale (le malattie o i giorni della settimana).[2]
[modifica] Classificazione alternativa
Nel 1946 lo psicologo Stanley Smith Stevens ha proposto una diversa classificazione dei caratteri definendo diverse scale "ammissibili" per i loro valori, classificate in funzione delle proprietà che possiede l'insieme dei valori di un carattere. Stevens ha proposto quattro scale di misura:
- una scala nominale possiede una relazione di equivalenza, ovvero permette di determinare se due valori sono uguali o diversi (il credo religioso);
- una scala ordinale possiede una relazione d'ordine totale, ovvero i valori possono essere ordinati e si può stabilire se uno è "maggiore", uguale o "minore" di un altro (il grado militare);
- una scala intervallare permette di calcolare la differenza tra due valori, quindi anche di ordinarli (l'anno dopo Cristo);
- una scala proporzionale permette di calcolare la proporzione tra due valori, quindi anche la loro differenza[3] (l'altezza).
Ognuna di queste scale è un caso particolare della precedente; solitamente per un carattere si adotta la "migliore possibile" tra quelle applicabili.
Ad esempio la temperatura misurata in kelvin segue una scala proporzionale (il rapporto tra due temperature compare ad esempio nella formula per l'efficienza termodinamica di una macchina di Carnot). Se viene invece misurata in gradi Celsius o Fahrenheit allora segue una scala intervallare: la proporzionalità manca a causa della scelta "arbitraria" delle temperature 0 °C e 0 °F.
Per i caratteri qualitativi nominale e ordinale si adotta la scala omonima. Per i caratteri quantitativi non c'è invece corrispondenza tra le due classificazioni discreto/continuo e intervallare/proporzionale.
[modifica] Classi
I valori dei caratteri possono essere raggruppati in classi; nel caso di caratteri quantitativi le classi sono sovente intervalli di valori (questo è quanto avviene solitamente approssimando le misurazioni.)
Ogni carattere quantitativo continuo può essere reso discreto tramite un'opportuna scelta degli intervalli. Ad esempio l'età espressa in anni ha classi della forma
a cui corrispondono i numeri naturali
. La scelta degli intervalli è arbitraria, ma deve ovviamente "coprire" tutti i casi possibili; per questo motivo vengono spesso scelti intervalli della forma
o
, in modo che i valori estremi siano compresi in uno e un solo intervallo.
[modifica] Grafici
Le rappresentazioni grafiche delle frequenze osservate possono essere scelte in funzione del tipo di carattere considerato.
Ad esempio su un istogramma possibile rappresentare valori in scala, o in intervalli, quindi può contenere più informazioni riguardo ad una variabile quantitativa rispetto ad un diagramma circolare.
[modifica] Note
- ^ In questa categoria ricadono anche caratteri i cui valori sono discreti ma possono essere determinati con una precisione molto alta e vengono "considerati" continui.
- ^ Tra i sette giorni della settimana il "primo" è convenzionalmente lunedì in Italia e domenica nel Regno Unito. Per ordinarli può venire adottata una qualunque convenzione artificiale, ad esempio l'ordine alfabetico.
- ^ Rispetto a un fissato valore che viene scelto come unità di misura.
(il numero di figli o gli anni di età).