Elaborazione del linguaggio naturale
L'elaborazione del linguaggio naturale (NLP, da natural language processing) è una sottobranca di linguistica, informatica e intelligenza artificiale che tratta l'interazione tra i computer e il linguaggio umano, in particolare sul come programmare i computer per elaborare e analizzare grande quantità di dati di linguaggio naturale. Lo scopo è rendere la tecnologia in grado di "comprendere" il contenuto dei documenti e le loro sfumature contestuali, in modo tale che possa quindi estrarre con precisione informazioni e idee contenute nei documenti, nonché classificare e categorizzare i documenti stessi.
Le sfide dell'elaborazione del linguaggio coinvolgono spesso il riconoscimento vocale, comprensione del linguaggio naturale e la generazione del linguaggio naturale.
Descrizione[modifica | modifica wikitesto]
Questo processo è reso particolarmente difficile e complesso a causa delle caratteristiche intrinseche di ambiguità del linguaggio umano. Per questo motivo il processo di elaborazione viene suddiviso in fasi diverse, tuttavia simili a quelle che si possono incontrare nel processo di elaborazione di un linguaggio di programmazione:
- analisi lessicale: scomposizione di un'espressione linguistica in token (in questo caso le parole)
- analisi grammaticale: associazione delle parti del discorso a ciascuna parola nel testo
- analisi sintattica: arrangiamento dei token in una struttura sintattica (ad albero: parse tree)
- analisi semantica: assegnazione di un significato (semantica) alla struttura sintattica e, di conseguenza, all'espressione linguistica
Nell'analisi semantica la procedura automatica che attribuisce all'espressione linguistica un significato tra i diversi possibili è detta disambiguazione.
Problematiche[modifica | modifica wikitesto]
In teoria, l'elaborazione del linguaggio naturale è un metodo di interazione uomo-macchina. I primi sistemi sviluppati, quali SHRDLU, che lavoravano in "mondi a blocchi" con vocabolari ristretti, ottenevano ottimi risultati. Ciò portò i ricercatori a un eccessivo ottimismo, che scemò non appena i sistemi furono estesi a situazioni più realistiche con problemi reali di ambiguità e complessità.
La comprensione del linguaggio naturale è spesso considerata un problema IA-completo, poiché si pensa che il riconoscimento del linguaggio richieda una conoscenza estesa del mondo e una grande capacità di manipolarlo. Per questa ragione, la definizione di "comprensione" è uno dei maggiori problemi dell'elaborazione del linguaggio naturale.[1]
Note[modifica | modifica wikitesto]
Bibliografia[modifica | modifica wikitesto]
- Isabella Chiari, Introduzione alla linguistica computazionale, Bari, Laterza, 2007, ISBN 978-88-420-8209-5.
Voci correlate[modifica | modifica wikitesto]
- Intelligenza artificiale
- Linguistica computazionale
- Sintesi vocale
- Lexxe
- Assistente virtuale
- Analisi del sentiment
- Entity linking
Collegamenti esterni[modifica | modifica wikitesto]
- (EN) Elaborazione del linguaggio naturale, su Enciclopedia Britannica, Encyclopædia Britannica, Inc.
- (EN) Opere riguardanti Natural language processing (Computer science) / Natural Language Processing, su Open Library, Internet Archive.
Controllo di autorità | LCCN (EN) sh88002425 · J9U (EN, HE) 987007536703305171 · NDL (EN, JA) 00562347 |
---|