Respeaking

Da Wikipedia, l'enciclopedia libera.
Vai alla navigazione Vai alla ricerca

Il respeaking, o rispeakeraggio o respeakeraggio, è una tecnica che sfrutta il riconoscimento del parlato per produrre testi di varia natura, dalla semplice trascrizione, alla resocontazione, ai sottotitoli in tempo reale per le persone sorde.

La tecnica del respeaking presuppone la presenza di un operatore, o respeaker, il quale lavora da solo oppure insieme ad un secondo operatore, o editor, che corregge in tempo reale l'output del primo, per poi validarlo. Per produrre sottotitoli televisivi, si verifica anche la necessità di affiancare una terza figura professionale, quella del coordinatore, che gestisce i cambi tra un respeaker e l'altro e, all'occorrenza, inserisce eventuali sottotitoli in preregistrato durante la diretta, o specifici bottoni virtuali che il respeaker può utilizzare, in sostituzione del parlato, quando si presentano parole straniere o che, comunque, il software non è in grado di riconoscere.

Il respeaking oggi può avere numerosi campi di applicazione: dalla semplice dettatura, infatti, si può passare ad operazioni più sofisticate di produzione di sottotitoli in tempo reale per convegni, conferenze, seminari, lezioni universitarie ed eventi di natura simile in tempo reale.

Il motore di riconoscimento commerciale Speaker Dependent più sfruttato nel passato è stato IBM Viavoice. Oggi è quello di Dragon NaturallySpeaking (Nuance) con un'elevata accuratezza in numerose lingue di lavoro, tra cui l'italiano.

La tecnologia più moderna sta producendo nuovi motori Speaker Independent, che permettono anche la trascrizione automatica di audio e video. Un motore di riconoscimento di questo tipo è, ad esempio, Synthema SpeechScribe.