Classificatore lineare

Da Wikipedia, l'enciclopedia libera.
Jump to navigation Jump to search

Nel campo dell'apprendimento automatico, l'obiettivo della classificazione statistica è utilizzare le caratteristiche di un oggetto per identificare a quale classe (o gruppo) appartiene. Un classificatore lineare realizza ciò prendendo una decisione di classificazione basata sul valore di una combinazione lineare delle caratteristiche. Le caratteristiche di un oggetto sono anche conosciute come valori di caratteristiche e sono tipicamente presentate alla macchina in un vettore chiamato vettore di caratteristiche. Questi classificatori funzionano bene per problemi pratici come la classificazione dei documenti e, più in generale, per problemi con molte variabili (caratteristiche), raggiungendo livelli di accuratezza paragonabili ai classificatori non lineari mentre richiedono meno tempo per allenarsi e usare.

Definizione[modifica | modifica wikitesto]

In questo caso, i punti vuoti e i punti pieni possono essere correttamente classificati da ogni numero di classificatori lineari. H1(blu) li classifica correttamente, come fa H2 (rosso). H2 potrebbe essere considerato "migliore" nel senso che è anche il più lontano da entrambi i gruppi. H3 (verde) fallisce nel classificare correttamente i punti

Se il vettore delle caratteristiche d'ingresso è un vettore di numeri reali allora il punteggio d'uscita è

dove è un vettore reale di pesi e f è una funzione che converte il prodotto scalare dei due vettori nell'uscita desiderata. In altre parole, è una funzione lineare che mappa in R. Il vettore peso è appreso da un insieme di campioni d'allenamento etichettati. Spesso f è una semplice funzione che mappa tutti i valori sopra una certa soglia alla prima classe e tutti gli altri valori alla seconda classe. Una f più complessa da la probabilità che un elemento appartenga a una certa classe.

Per un problema di classificazione a due classi, una può visualizzare l'operazione di un classificatore lineare come la divisione di un ingresso di uno spazio multidimensionale con un iperpiano: tutti i punti su un lato dell'iperpiano sono classificati come "si" e gli altri come "no".

Voci correlate[modifica | modifica wikitesto]