Disambiguazione

Da Wikipedia, l'enciclopedia libera.
Vai alla navigazione Vai alla ricerca

La disambiguazione (in inglese Word Sense Disambiguation o, abbreviato, WSD) è il processo con il quale si precisa il significato di una parola o di un insieme di parole (frase), che denota significati diversi a seconda dei contesti, per evitare che sia ambigua.

La disambiguazione, mediante appositi algoritmi, riveste particolare importanza nelle ricerche sull'intelligenza artificiale e, in particolare, sull'elaborazione del linguaggio naturale. Specificamente, si prevedono benefici della disambiguazione in programmi di traduzione automatica, recupero dell'informazione, estrazione automatica di informazioni, ecc., che però non danno informazioni esatte riguardo al contesto ambientale in cui ci si trova in quell’istante.

I due esempi seguenti riguardano significati distinti della parola rombo:

  1. Ho acquistato un rombo fresco al mercato
  2. Il rombo ha quattro lati della stessa lunghezza

Sebbene per un essere umano sia ovvio che la prima frase si riferisce al significato di pesce e la seconda a quello di figura geometrica, sviluppare algoritmi per replicare questa capacità umana è tipicamente difficile.

Problematiche

[modifica | modifica wikitesto]

Un problema fondamentale della disambiguazione riguarda l'identificazione dei significati delle parole (inventari di senso). Quando una parola assume più significati, essa è detta polisemica. In casi quali la parola rombo, alcuni dei significati appaiono chiaramente distinti. Tali significati sono detti omonimi. Tuttavia, esistono altri casi di significati differenti strettamente correlati. Un esempio è quello di un significato correlato a un altro significato mediante metafora (ad esempio, divorare un patrimonio) o metonimia (bere un bicchiere). In tali casi, la suddivisione dei significati è molto più difficile: diversi dizionari forniscono suddivisioni differenti di significati per le parole. Una soluzione adottata dai ricercatori è stata quella di scegliere un particolare dizionario della lingua inglese, WordNet, e utilizzare il suo insieme di significati. Ricerche sono state effettuate anche utilizzando gli equivalenti di WordNet in altre lingue (per l'italiano, esistono BabelNet,[1] ItalWordNet[2] e MultiWordNet[3]). Sfortunatamente, WordNet codifica distinzioni di significato troppo raffinate, portando a prestazioni di disambiguazione deludenti. Ultimamente, sono state create distinzioni di significato meno raffinate che hanno portato a prestazioni di disambiguazione per la lingua inglese tra l'80% e il 90%.[4]

  1. ^ R. Navigli, S. P. Ponzetto. BabelNet: Building a Very Large Multilingual Semantic Network. Proc. of the 48th Annual Meeting of the Association for Computational Linguistics (ACL 2010), Uppsala, Sweden, July 11-16, 2010, pp. 216-225.
  2. ^ Roventini A., Alonge A., Calzolari N., Magnini B., Bertagna F. (2000), "ItalWordNet: a Large Semantic Database for Italian", Proc. of the 2nd International Conference on Language Resources and Evaluation (LREC 2000), Athens, Greece, 2000, pp. 783-790.
  3. ^ E. Pianta, L. Bentivogli, C. Girardi. MultiWordNet: developing an aligned multilingual database, Proc. of the First International Conference on Global WordNet, Mysore, India, January 21-25, 2002.
  4. ^ R. Navigli, K. Litkowski, O. Hargraves. 2007. SemEval-2007 Task 07: Coarse-Grained English All-Words Task. Proc. of Semeval-2007 Workshop (SemEval), in the 45th Annual Meeting of the Association for Computational Linguistics (ACL 2007), Prague, Czech Republic, pp. 30–35.

Voci correlate

[modifica | modifica wikitesto]

Altri progetti

[modifica | modifica wikitesto]
Controllo di autoritàLCCN (ENsh85119869 · GND (DE4233548-6 · J9U (ENHE987007531766805171