Apprendimento supervisionato

Da Wikipedia, l'enciclopedia libera.
Vai a: navigazione, cerca

L'Apprendimento supervisionato è una tecnica di apprendimento automatico che mira a istruire un sistema informatico in modo da consentirgli di risolvere dei compiti in automatico.

  • Si definiscono i dati in ingresso come insieme I, (tipicamente vettori)
  • Si definisce l'insieme dei dati in uscita come insieme O (gli output possono essere valori continui (regressione), o una etichetta numerica)
  • Si definisce una funzione h che associa ad ogni dato in ingresso (I) la sua risposta corretta (O)

Tutti gli algoritmi di apprendimento supervisionato partono dal presupposto che se forniamo all'algoritmo un numero adeguato di esempi l'algoritmo sarà in grado di creare una funzione h1 che approssimerà la funzione h. Se l'approssimazione di h risulterà adeguata quando proporremo ad h1 dei dati in ingresso mai analizzati la funzione dovrebbe essere in grado di fornire delle risposte in uscita simili a quelle fornite da h e quindi corrette o quasi.

Molti di questi algoritmi in sostanza lavorano in un mondo lineare, presupponendo che ingressi simili necessitino di uscite simili. Nel nostro mondo questo in generale non è vero, basta vedere le dinamiche caotiche legate al tempo, ma esistono molte condizioni in cui questa semplificazione è accettabile. Si può facilmente intuire che il buon funzionamento di questi algoritmi dipende in modo significativo dai dati in ingresso; se si forniscono pochi ingressi l'algoritmo potrebbe non aver abbastanza esperienza, mentre molti dati in ingresso potrebbero rendere eccessivamente lento l'algoritmo, dato che la funzione h1 generata dagli ingressi potrebbe essere molto complicata. Questi algoritmi sono molto sensibili al rumore, anche pochi dati errati potrebbero rendere l'intero sistema non affidabile e condurlo a decisioni errate.

Tradizionalmente i principali algoritmi sono stati:

La ricerca oggi si concentra su quelle che sono considerate le due classi principali di algoritmi possibili:

  • Metodi Generativi
  • Metodi Discriminativi

I metodi generativi si basano sulla creazione di un modello dei dati che poi viene utilizzato per predire le risposte desiderate (o dati di uscita). Esempi sono le Reti Bayesiane o più in generale i Modelli Grafici.

I metodi discriminativi al contrario cercano di modellare direttamente la relazione tra dati in entrata e quelli in uscita, in modo da minimizzare una funzione di perdita (loss function in letteratura). Esempi di questo tipo di modello sono le Macchine a vettori di supporto (Support Vector Machines) e più in generale i Metodi basati su funzioni di kernel.

[modifica] Voci correlate

Strumenti personali
Namespace

Varianti
Azioni
Navigazione
Comunità
Stampa/esporta
Strumenti
Altre lingue