Utente:Karmwiki/Sandbox4

Da Wikipedia, l'enciclopedia libera.
Vai alla navigazione Vai alla ricerca

Testo tradotto da Wikipedia http://es.wikipedia.org/wiki/Traducci%C3%B3n_autom%C3%A1tica_mediante_lengua_intermedia

La traduzione automatica mediante lingua intermedia è una delle strategie classiche della traduzione automatica L' idea fondante di questo metodo indiretto di traduzione è di tradurre il brano di testo origine in una lingua intermedia e independiente dalle due, quella d'origine e la destinataria, per poi tradurlo nella lingua destinataria.


Figura 1. Diagramma delle lingue che intervengono nel processo di traduzione utilizando una lingua ponte.


Storia[modifica | modifica wikitesto]

Le prime idee di traduzione automatica tramite lingua intermedia comparvero già nel secolo XVII, con Cartesio e Leibniz. Ambedue hanno formulato teorie sull'elaborazione di dizionari fondati su codici numerici universali. Cave Beck, Athanasius Kircher e Johann Joachim Becher, per la loro parte, hanno lavorato per sviluppare una lingua universale senza ambiguità fondata su principi logici e simboli iconici. Nel 1668, John Wilkins elaboró una interlingua su Essay towards a Real Character and a Philosophical Language.


Nei secoli XVIII e XIX apparvero molte altre proposte di lingue internazionali, la più conosciuta delle quali è l'Esperanto.


Comunque, l'idea di una lingua universale finalizzata alla traduzione automatica non è emersa fin dall'inizio, giacché si è cominciato a lavorare con la traduzione diretta tra coppie di lingue. Fu durante la decade dal 1956 al 1966 quando cominciarono a studiarsi alcune idee a Cambridge dirette da Margaret Masterman, a Milano da Silvio Ceccato e a Leningrado da Nikolai Andrev.


Durante la decade del 1970 si evidenziano studi realizzati a Grenoble con l'obiettivo di tradurre lavori di matematica e física dal russo in francese, malgrado non fosse esattamente mediante una lengua intermedia. Un lavoro simile era quello che si sviluppava nel Texas (METAL).


Nella decade del 1980 prendono piede i sistemi fondati su interlingua e i "Sistemi fondati sulla conoscenza" Sistemas Basados en el Conocimiento, con molteplici studi sul tema. Il fattore comune a tutte questi studi è che partono dall'idea che è necessaria la comprensione del testo si se vuole perseguire una traduzione di qualità. Perciò, la traduzione deve essere fondata sia sulla conoscenza linguistica che su quella del dominio concreto dell'applicazione, cercando l'armonia fra le due e segnatamente su quest'ultima.

Gli studi di maggiore importanza a partire da questa decade furono la "Traduzione Distribuita" DLT a Utrecht e il sistema Fujitsu in Giappone. DLT utilizza una variante dell'esperanto.


Traduzione tramite una lingua intermedia[modifica | modifica wikitesto]

thumb|300px|Figura 2. a) Grafo delle traduzioni necessarie nel caso della traduzione diretta (ci vogliono 12 dizionari di traduzione; b) grafico delle traduzioni necessarie mediante lingua ponte (necessari solo 8 moduli di traduzione).


La traduzione tramite una lingua intermedia è un sistema che copre l'analisi di frasi di un testo scritto in lingua di origine per imporre loro le caracteristiche morfologiche, sintattiche e semantica semantiche correspondenti alla lingua obiettivo/destinataria, realizando una prima traduzione del testo analizzato in una lingua intermedia/ponte. Questa lingua dispone di tutti le caratteristiche morfologiche, sintattiche e semantiche delle lingue da tradurre, piuttosto che tradurre direttamente dalla lingua di origine alla destinataria.


thumb|300px|Figura 3: Grafo di traduzioni mediante due lingue intermedie.


In certi casi si usano due lingue intermedie per ottimizzare la traduzione, giacché così si rende possibile che una delle due si adegui meglio alle caracteristiche della lengua origine, resultando una traduzion più facile. La seconda lingua intermedia ha quindi tutte le caratteristiche strutturali della lingua di destinazione, per convertire le frasi della prima lingua intermedia in altre grammaticalmente più vicine alla lingua di destinazione. La seconda lingua intermedia utilizza un vocabolario più specifico e vicino alla lingua di destinazione e, per finire la traduzione, estrae l'analisi strutturale delle frasi in lingua di destinazione.


Questo sistema si basa pertanto sul approccio interlinguistico in modo da ottimizzare la traduzione di un testo originale in più lingue, strutturalmente vicine, da un'unica analisi. Le caratteristiche dell'approccio interlinguistico assicurano una più facile integrazione nei sistemi di lingue che sono indipendenti tipologicamente, tra i quali non sarebbe possibile garantire una proiezione delle informazioni linguistiche senza un'analisi esaustiva dell'informazione contestuale e/o semantica del messaggio. In fase di sviluppo, l'invenzione ha considerato solo le lingue più parlate, ma poi ha dato particolare attenzione e cura a sviluppare sistemi validi che permettono estensioni a tutte le lingue. Inoltre, questo sistema è applicabile alla traduzione automatica di testi, alla gestione dei database e al riconoscimento vocale.


Processo di traduzione[modifica | modifica wikitesto]

In un sistema interlinguistico ci sono due componenti monolingue: La' analisi" del linguaggio sorgente a Interlingua, e la "generazione da Interlingua alla lingua di destinazione. Ma possiamo distinguere tra i sistemi interlingua che impiegano un metodo sintattico (inizi del 1970, Università di Grenoble e l'Università del Texas) e quelli basati su tecniche di intelligenza artificiale (dal 1987 in Giappone e la ricerca presso le università di Southern California Carnegie Mellon).


Nel primo caso, lo schema di traduzione sarebbe corrispondente alla figura 1, mentre l'altro sarebbe il sistema fondato sulla conoscenza, che segue lo schema di figura 4.


thumb|600px|none|Figura 4: Processo di traduzione in un [http://es.wikipedia.org/wiki/Sistemas_Basados_en_el_Conocimiento sistemas basados en el conocimiento].


Le risorse necessarie sono, pertanto, le seguenti:

  • Dizionario concettuale (dominio dipendente). E' il database di conoscenza di eventi ed entità all'interno del dominio.
  • Regole di proiezione (dominio dipendente e lingue).
  • Grammatica Grammatiche di analisi e generazione (dipendente dal dominio e dalle lingue)


Il problema dei sistemi basati sulla conoscenza è che non è facile evitare lo sviluppo di database per i domini che non hanno un alto grado di specificità. Essi hanno anche un costo elevato di calcolo.


Vantaggi della traduzione automatica con interlingua[modifica | modifica wikitesto]

Il sicuro vantaggio di questa strategia è che offre robustezza e, soprattutto, economia nella traduzione in sistemi multilingue. Infatti, mediante il metodo tradizionale di traduzione diretta necessitiamo una coppia di moduli traduttori per ciascuna coppia di lingue (in totale N*(N-1) moduli, come si può apprezzare nella Figura 2); mentre invece per la traduzione mediante lingua intermedia necessitiamo soltanto 2*N moduli, giacché ciascuna lingua si relaziona soltanto con la lingua intermedia.


A causa di questo fatto, l'aggiunta di una nuova lingua nel nostro sistema non comporta molto impegno come lo sarebbe in un sistema che segue un metodo diretto traduzione. Servirà soltanto relazionare la nuova lingua con la lingua intermedia, invece di relazionarla con ciascuna delle lingue esistenti nel nostro sistema.


Svantaggi della traduzione automatica con interlingua[modifica | modifica wikitesto]

L'inconveniente principale di questa strategia è la difficoltà di definire la lingua intermedia. Questa deve comportare le seguenti caratteristiche:

  • Sintetica
  • Indipendente e dalla lingua origine dalla lingua di destinazione


Quanto maggiore sarà il numero di lingue e più distinte, tanto più ricca dovrà essere la lingua intermedia per poter esprimere tutti gli affinamenti. Inoltre, per una traduzione di qualità si deve rappresentare il significato del testo, e non una trasformazione della struttura superficiale senza capirlo.


Un altro problema è la complessità per estrarre le informazioni giuste del testo originale per generare la rappresentazione intermedia e generare il testo finale da esso, in quanto vi sono diverse possibilità nella lingua di destinazione.


A tutto questo dobbiamo aggiungere la perdita di informazioni che comporta l'uso di due traduzioni, invece di una diretta, e l'incremento di tempo necesario perché ambedue le traduzioni devono essere eseguite in sequenza.


Conclusioni[modifica | modifica wikitesto]

La traduzione automatica può non tradurre perfettamente una lingua a causa di errori sintattici, ma permette ai lettori di comprendere il significato globale di un documento.


A contrapposizione dei diversi vantaggi, come la minor fatica e la maggiore modularità, l'uso di una lingua intermedia, nella traduzione automatica, implica alcuni inconvenienti. La perdita di informazione come risultato di due traduzioni nel percorso di trasformazione dalla lingua origine a quella destinataria e l'incremento di tempo di traduzione prodotto dalla necessità di realizzare tali traduzioni sequenzialmente, sono i principali problemi.


Vedi anche[modifica | modifica wikitesto]


[[Categoria:Linguistica computazionale]]
[[Categoría:Traduzione automatica]]