Classificatore bayesiano

Da Wikipedia, l'enciclopedia libera.
Vai alla navigazione Vai alla ricerca

Un classificatore bayesiano è un classificatore basato sull'applicazione del teorema di Bayes[1].

Il classificatore bayesiano richiede la conoscenza delle probabilità a priori e condizionali relative al problema, quantità che in generale non sono note ma sono tipicamente stimabili. Se è possibile ottenere delle stime affidabili delle probabilità coinvolte nel teorema, il classificatore bayesiano risulta generalmente affidabile e potenzialmente compatto. Spesso viene detto "classificatore bayesiano completo" (full Bayes classifier o anche belief network). Per costruzione, il classificatore bayesiano minimizza il rischio di classificazione[1].

Nel gergo della classificazione di testi, con il termine "classificatore bayesiano" ci si riferisce convenzionalmente al cosiddetto "classificatore bayesiano ingenuo" (naïve Bayes classifier)[1][2], ossia un classificatore bayesiano semplificato con un modello di probabilità sottostante che fa l'ipotesi di indipendenza delle caratteristiche, cioè assume che la presenza o l'assenza di un particolare attributo in un documento testuale non è correlata alla presenza o assenza di altri attributi.

In queste ipotesi semplificate (dette appunto "ingenue", in inglese anche idiot), il modello è realizzabile con molta maggiore facilità. L'esperienza dimostra che il metodo funziona in molti problemi pratici[3], come per esempio il filtraggio anti-spam adattivo[4].

Note[modifica | modifica wikitesto]

  1. ^ a b c Duda, R. O. & P. E. Hart (1973), Pattern Classification and Scene Analysis, New York: John Wiley & Sons
  2. ^ Langley, P., W. Iba, & K. Thompson (1992), An analysis of Bayesian classifiers, da Proceedings, Tenth National Conference on Artificial Intelligence (pp. 223–228). Menlo Park, CA: AAAI Press
  3. ^ N. Friedman, D. Geiger, & M. Goldszmit (1997), Bayesian Network Classifiers, in Machine Learning, 29, 131–163
  4. ^ M. Sahami, S. Dumais, D. Heckerman, E. Horvitz (1998), A Bayesian approach to filtering junk e-mail, AAAI'98 Workshop on Learning for Text Categorization

Voci correlate[modifica | modifica wikitesto]