Classificatore bayesiano

Da Wikipedia, l'enciclopedia libera.

Un classificatore bayesiano è un classificatore basato sull'applicazione del teorema di Bayes[1].

Il classificatore bayesiano richiede la conoscenza delle probabilità a priori e condizionali relative al problema, quantità che in generale non sono note ma sono tipicamente stimabili. Se è possibile ottenere delle stime affidabili delle probabilità coinvolte nel teorema, il classificatore bayesiano risulta generalmente affidabile e potenzialmente compatto. Spesso viene detto classificatore bayesiano completo (Full Bayes Classifier) o anche Belief Network. Per costruzione, il classificatore bayesiano minimizza il rischio di classificazione[1].

Nel gergo della classificazione di testi o Text Categorization, con il termine classificatore bayesiano ci si riferisce convenzionalmente al classificatore bayesiano naif (Naive Bayes Classifier)[1][2], ossia un classificatore bayesiano semplificato con un modello di probabilità sottostante che fa l'ipotesi di indipendenza delle feature, ovvero assume che la presenza o l'assenza di una particolare feature in un documento testuale non è correlata alla presenza o assenza di altre feature.

In queste ipotesi semplificate (dette appunto naif o anche idiot), il modello è realizzabile con molta maggiore facilità. L'esperienza dimostra che il metodo funziona in molti problemi pratici[3], come per esempio il filtraggio antispam adattivo[4].

Note[modifica | modifica sorgente]

  1. ^ a b c Duda, R. O. & P. E. Hart (1973), Pattern Classification and Scene Analysis, New York: John Wiley & Sons
  2. ^ Langley, P., W. Iba, & K. Thompson (1992), An analysis of Bayesian classifiers, da Proceedings, Tenth National Conference on Artificial Intelligence (pp. 223–228). Menlo Park, CA: AAAI Press
  3. ^ N. Friedman, D. Geiger, & M. Goldszmit (1997), Bayesian Network Classifiers, in Machine Learning, 29, 131–163
  4. ^ M. Sahami, S. Dumais, D. Heckerman, E. Horvitz (1998), A Bayesian approach to filtering junk e-mail, AAAI'98 Workshop on Learning for Text Categorization

Voci correlate[modifica | modifica sorgente]