Carattere (statistica): differenze tra le versioni

Da Wikipedia, l'enciclopedia libera.
Vai alla navigazione Vai alla ricerca
Contenuto cancellato Contenuto aggiunto
Nessun oggetto della modifica
Nessun oggetto della modifica
Riga 44: Riga 44:
* [[Insieme numerabile]]
* [[Insieme numerabile]]
* [[Relazione d'ordine]]
* [[Relazione d'ordine]]
* [[Statistica]]
* [[Statistica descrittiva]]
* [[Statistica inferenziale]]


{{portale|matematica|statistica}}
{{portale|matematica|statistica}}

Versione delle 14:05, 27 lug 2013

In statistica un carattere è il tipo di dati sul quale si concentra uno studio statistico, cioè è una variabile oggetto di studio.

Esempi di caratteri su un campione di persone sono: l'altezza, l'età, il colore degli occhi, il genere, il segno zodiacale, il credo religioso.

Classificazione

I caratteri vengono usualmente classificati nella seguente maniera.

  • Un carattere quantitativo esprime una quantità, ovvero dei valori numerici (l'altezza o il numero di figli).
    • Un carattere quantitativo discreto o discontinuo assume una quantità finita o numerabile di valori, ovvero i suoi possibili valori possono essere indicati (il numero di figli o gli anni di età).
    • Un carattere quantitativo continuo assume una quantità non numerabile ma continua di valori, che cioè possono assumere tutti i valori intermedi di un intervallo (ad esempio il peso o l'altezza).[1]
  • Un carattere qualitativo esprime una qualità, ovvero dei valori non numerici (il genere o il credo religioso).
    • Un carattere qualitativo ordinale (o ordinato o ordinabile) assume valori che posseggono naturalmente un ordine, ovvero che possono essere disposti lungo una scala (ad esempio gli attributi "pessimo", "cattivo", "mediocre", "buono" e "ottimo" oppure i giorni della settimana[2]).
    • Un carattere qualitativo nominale (o sconnesso) assume valori che non posseggono alcun ordine naturale (le malattie o il colore degli occhi).

Classificazione alternativa

Nel 1946 lo psicologo Stanley Smith Stevens ha proposto una diversa classificazione dei caratteri definendo diverse scale "ammissibili" per i loro valori, classificate in funzione delle proprietà che possiede l'insieme dei valori di un carattere. Stevens ha proposto quattro scale di misura:

  • una scala nominale possiede una relazione di equivalenza, ovvero permette di determinare se due valori sono uguali o diversi (il credo religioso);
  • una scala ordinale possiede una relazione d'ordine totale, ovvero i valori possono essere ordinati e si può stabilire se uno è "maggiore", uguale o "minore" di un altro (il grado militare);
  • una scala intervallare permette di calcolare la differenza tra due valori, quindi anche di ordinarli (l'anno dopo Cristo);
  • una scala proporzionale permette di calcolare la proporzione tra due valori, quindi anche la loro differenza[3] (l'altezza).

Ognuna di queste scale è un caso particolare della precedente; solitamente per un carattere si adotta la "migliore possibile" tra quelle applicabili.

Ad esempio la temperatura misurata in kelvin segue una scala proporzionale (il rapporto tra due temperature compare ad esempio nella formula per l'efficienza termodinamica di una macchina di Carnot). Se viene invece misurata in gradi Celsius o Fahrenheit allora segue una scala intervallare: la proporzionalità manca a causa della scelta "arbitraria" delle temperature 0 °C e 0 °F.

Per i caratteri qualitativi nominali e ordinali si adotta la scala omonima. Per i caratteri quantitativi non c'è invece corrispondenza tra le due classificazioni discreto/continuo e intervallare/proporzionale.

Classi

I valori dei caratteri possono essere raggruppati in classi; nel caso di caratteri quantitativi le classi sono sovente intervalli di valori (questo è quanto avviene solitamente approssimando le misurazioni.)

Ogni carattere quantitativo continuo può essere reso discreto tramite un'opportuna scelta degli intervalli. Ad esempio l'età espressa in anni ha classi della forma a cui corrispondono i numeri naturali . La scelta degli intervalli è arbitraria, ma deve ovviamente "coprire" tutti i casi possibili senza sovrapposizioni, cioè deve essere una partizione; per questo motivo vengono spesso scelti intervalli della forma o , in modo che i valori estremi siano compresi in uno e un solo intervallo.

Grafici

Le rappresentazioni grafiche delle frequenze osservate possono essere scelte in funzione del tipo di carattere considerato.

Ad esempio su un istogramma possibile rappresentare valori in scala, o in intervalli, quindi può contenere più informazioni riguardo ad una variabile quantitativa rispetto ad un diagramma circolare.

Note

  1. ^ In questa categoria ricadono anche caratteri i cui valori sono discreti ma possono essere determinati con una precisione molto alta e vengono "considerati" continui.
  2. ^ Tra i sette giorni della settimana il "primo" è convenzionalmente lunedì in Italia e domenica nel Regno Unito.
  3. ^ Rispetto a un fissato valore che viene scelto come unità di misura.

Bibliografia

  • G. Leti. Statistica descrittiva. Bologna, Il Mulino, 1983.

Voci correlate