Disambiguazione

Da Wikipedia, l'enciclopedia libera.

La disambiguazione (in inglese Word Sense Disambiguation o, abbreviato, WSD) è l'operazione con la quale si precisa il significato di una parola o di un insieme di parole (frase), che denotano significati diversi a seconda dei contesti.

Il problema della disambiguazione, mediante appositi algoritmi, riveste particolare importanza nelle ricerche sull'intelligenza artificiale e, in particolare, sull'elaborazione del linguaggio naturale. Specificamente, si prevedono benefici della disambiguazione in programmi di traduzione automatica, recupero dell'informazione, estrazione automatica di informazioni, ecc.

I due esempi seguenti riguardano significati distinti della parola rombo:

  1. Ho acquistato un rombo al mercato
  2. Il rombo è una figura geometrica i cui quattro lati hanno la stessa lunghezza

Sebbene per un essere umano sia ovvio che la prima frase si riferisce al significato di pesce e la seconda a quello di figura geometrica, sviluppare algoritmi per replicare questa capacità umana è tipicamente difficile.

Problematiche[modifica | modifica sorgente]

Un problema fondamentale della disambiguazione riguarda l'identificazione dei significati delle parole (inventari di senso). Quando una parola assume più significati, essa è detta polisemica. In casi quali la parola rombo, alcuni dei significati appaiono chiaramente distinti. Tali significati sono detti omonimi. Tuttavia, esistono altri casi di significati differenti strettamente correlati. Un esempio è quello di un significato correlato a un altro significato mediante metafora (ad esempio, divorare un patrimonio) o metonimia (bere un bicchiere). In tali casi, la suddivisione dei significati è molto più difficile: diversi dizionari forniscono suddivisioni differenti di significati per le parole. Una soluzione adottata dai ricercatori è stata quella di scegliere un particolare dizionario della lingua inglese, WordNet, e utilizzare il suo insieme di significati. Ricerche sono state effettuate anche utilizzando gli equivalenti di WordNet in altre lingue (per l'italiano, esistono BabelNet[1], ItalWordNet[2] e MultiWordNet[3]). Sfortunatamente, WordNet codifica distinzioni di significato troppo raffinate, portando a prestazioni di disambiguazione deludenti. Ultimamente, sono state create distinzioni di significato meno raffinate che hanno portato a prestazioni di disambiguazione per la lingua inglese tra l'80% e il 90%[4].

Note[modifica | modifica sorgente]

  1. ^ R. Navigli, S. P. Ponzetto. BabelNet: Building a Very Large Multilingual Semantic Network. Proc. of the 48th Annual Meeting of the Association for Computational Linguistics (ACL 2010), Uppsala, Sweden, July 11-16, 2010, pp. 216-225.
  2. ^ Roventini A., Alonge A., Calzolari N., Magnini B., Bertagna F. (2000), "ItalWordNet: a Large Semantic Database for Italian", Proc. of the 2nd International Conference on Language Resources and Evaluation (LREC 2000), Athens, Greece, 2000, pp. 783-790.
  3. ^ E. Pianta, L. Bentivogli, C. Girardi. MultiWordNet: developing an aligned multilingual database, Proc. of the First International Conference on Global WordNet, Mysore, India, January 21-25, 2002.
  4. ^ R. Navigli, K. Litkowski, O. Hargraves. 2007. SemEval-2007 Task 07: Coarse-Grained English All-Words Task. Proc. of Semeval-2007 Workshop (SemEval), in the 45th Annual Meeting of the Association for Computational Linguistics (ACL 2007), Prague, Czech Republic, pp. 30–35.

Bibliografia[modifica | modifica sorgente]

Voci correlate[modifica | modifica sorgente]