Test di Turing

Da Wikipedia, l'enciclopedia libera.
Jump to navigation Jump to search
Rappresentazione grafica del test di Turing.

Il test di Turing è un criterio per determinare se una macchina sia in grado di pensare. Tale criterio è stato suggerito da Alan Turing nell'articolo Computing machinery and intelligence, apparso nel 1950 sulla rivista Mind.[1]

Descrizione[modifica | modifica wikitesto]

Nell'articolo Turing prende spunto da un gioco, chiamato "gioco dell'imitazione", a tre partecipanti: un uomo A, una donna B, e una terza persona C. Quest'ultima è tenuta separata dagli altri due e tramite una serie di domande deve stabilire qual è l'uomo e quale la donna. Dal canto loro anche A e B hanno dei compiti: A deve ingannare C e portarlo a fare un'identificazione errata, mentre B deve aiutarlo. Affinché C non possa disporre di alcun indizio (come l'analisi della grafia o della voce), le risposte alle domande di C devono essere dattiloscritte o similarmente trasmesse.

Il test di Turing si basa sul presupposto che una macchina si sostituisca ad A. Se la percentuale di volte in cui C indovina chi sia l'uomo e chi la donna è simile prima e dopo la sostituzione di A con la macchina, allora la macchina stessa dovrebbe essere considerata intelligente, dal momento che - in questa situazione - sarebbe indistinguibile da un essere umano.

Per macchina intelligente Turing ne intende una in grado di pensare, ossia capace di concatenare idee e di esprimerle. Per Turing, quindi, tutto si limita alla produzione di espressioni non prive di significato. Nell'articolo, riprendendo il Cogito cartesiano, si legge:

« Secondo la forma più estrema di questa opinione, il solo modo per cui si potrebbe essere sicuri che una macchina pensa è quello di essere la macchina stessa e sentire se si stesse pensando. [...] Allo stesso modo, la sola via per sapere che un uomo pensa è quello di essere quell'uomo in particolare. [...] Probabilmente A crederà "A pensa, mentre B no", mentre per B è l'esatto opposto "B pensa, ma A no". Invece di discutere in continuazione su questo punto, è normale attenersi alla educata convenzione che ognuno pensi. »

Le macchine di Turing sono macchine a stati finiti in grado di simulare altre macchine a stati discreti. Una macchina per sostenere il test dev'essere programmata considerando la descrizione di un uomo in termini discreti (stati interni, segnali, simboli). Dalla complessità del software, si legge tra le righe dell'articolo, emergeranno le funzioni intellettuali. Su questa aspettativa si fonda una disciplina nota come intelligenza artificiale il cui scopo è la costruzione di una macchina in grado di riprodurre le funzioni cognitive umane.

Prove a confutazione del test[modifica | modifica wikitesto]

Il test di Turing è stato via via riformulato durante gli anni. Le ragioni sono varie e passano dall'imprecisione della formulazione originale, al sorgere di nuovi problemi relativi alla definizione di macchina intelligente. A volte semplici programmi, come ad esempio ELIZA (un programma che emula un terapista rogersiano), hanno costretto a riformulare i criteri del test perché inadeguati o troppo facilmente soddisfatti da programmi evidentemente non pensanti.

Il filosofo John Searle ha proposto una modifica al test di Turing, che ha preso il nome di stanza cinese, sostenendo l'inattendibilità del test di Turing come prova sufficiente a dimostrare che una macchina o un qualsiasi sistema informatico siano sistemi dotati di vera intelligenza, sia che questi abbiano superato o no tale test.

Varianti successive[modifica | modifica wikitesto]

Numerose altre versioni del test di Turing, comprese quelle esposte sopra, sono state sollevate nel corso degli anni.

Turing test totale[modifica | modifica wikitesto]

La variante totale[2] del test di Turing, proposta dallo scienziato cognitivo Stevan Harnad[3], aggiunge due ulteriori requisiti al test di Turing tradizionale. L'interrogatore può anche testare le abilità percettive del soggetto (il che coinvolge la visione artificiale) e la capacità del soggetto di manipolare gli oggetti (coinvolgendo la robotica).Russell, Stuart J.; Norvig, Peter (2010), Artificial Intelligence: A Modern Approach (3rd ed.), Upper Saddle River, NJ: Prentice Hall.

Test di Turing dell'esperto[modifica | modifica wikitesto]

Un'altra variante è descritta come il test di Turing dell'esperto, in cui la risposta di una macchina non può essere distinta da un esperto in un dato campo. Questo è anche noto come "test Feigenbaum" ed è stato proposto da Edward Feigenbaum in un documento del 2003.[4][5]

Record sanitari elettronici[modifica | modifica wikitesto]

Una lettera pubblicata su Communications of the ACM[6] concepisce la generazione di una popolazione di pazienti artificiali e propone una variazione del test di Turing per valutare la differenza tra questi e dei pazienti reali. La lettera recita: "Sebbene un medico umano possa facilmente distinguere tra i pazienti generati artificialmente e quelli umani, [ci si chiede se], nel contesto della CCE, è possibile fornire una macchina dell'intelligenza per fare una tale determinazione da sola" e inoltre la lettera recita: "Prima che le identità sintetiche dei pazienti diventino un problema di salute pubblica, il mercato legale delle CCE potrebbe trarre vantaggio dall'applicazione di tecniche di test di Turing per garantire maggiore affidabilità e valore diagnostico dei dati. Qualsiasi nuova tecnica deve quindi considerare l'eterogeneità dei pazienti e è probabile che abbia una complessità maggiore rispetto alla sfida di Allen".[7]

Test del minimo segnale intelligente[modifica | modifica wikitesto]

Il test del minimo segnale intelligente (Minimum intelligent signal test) è stato proposto da Chris McKinstry come "la massima astrazione del test di Turing",[8] in cui sono consentite solo le risposte binarie (vero / falso o sì / no), per concentrarsi solo sulla capacità di pensiero. Elimina i problemi di chat testuale come il pregiudizio antropomorfismo (cioè il distinguere una macchina da un uomo perché non capisce atteggiamenti umani che non hanno diretta correlazione con l'intelligenza di per sé come il parlare alle piante o adorare una divinità) e non richiede l'emulazione di comportamenti umani non intelligenti (come l'attenzione allo stile), ammettendo sistemi che differiscono dall'intelligenza umana. Tuttavia, le domande devono essere isolate, rendendolo più simile a un test del QI che a un interrogatorio. Generalmente viene utilizzato per raccogliere dati statistici rispetto ai quali misurare le prestazioni dei programmi di intelligenza artificiale.[9]

Test di Turing inverso e CAPTCHA[modifica | modifica wikitesto]

Una modifica del test di Turing in cui è stato invertito l'obiettivo di uno o più ruoli tra le macchine e l'uomo è definito un test di Turing inverso. Un esempio è implicito nel lavoro dello psicanalista Wilfred Bion,[10] che era particolarmente affascinato dalla "tempesta" (in inglese 'storm') risultante dell'incontro di una mente con un'altra. Nel suo libro del 2000,[11] tra diversi altri punti originali per quanto riguarda il test di Turing, lo studioso letterario Peter Swirski ha discusso in dettaglio l'idea di ciò che ha definito il test Swirski, essenzialmente il test di Turing inverso, sottolineando che supera la maggior parte delle obiezioni alla versione standard. Portando avanti questa idea, R. D. Hinshelwood[12] descrisse la mente come un "apparato per riconoscere la mente". La sfida sarebbe che il computer fosse in grado di determinare se stesse interagendo con un essere umano o con un altro computer. Questa è un'estensione della domanda originale cui Turing ha tentato di rispondere ma potrebbe offrire uno protocollo sufficientemente accurato per definire una macchina in grado di "pensare" in un modo che tipicamente definiamo tipicamente umano.

Il CAPTCHA è di fatto una forma di test di Turing inverso. Prima di poter eseguire un'azione su un sito Web, all'utente vengono presentati caratteri alfanumerici in un'immagine grafica distorta e gli viene chiesto di digitarli. Questo ha lo scopo di impedire che i sistemi automatici vengano utilizzati per abusare del sito. La logica è che attualmente non esiste un software sufficientemente sofisticato da leggere e riprodurre l'immagine distorta (o comunque non è disponibile per l'utente medio), quindi se un sistema è in grado di farlo è probabile che sia un essere umano. Lo sviluppo dei software in grado di decriptare un CAPTCHA con una certa accuratezza, analizzando i pattern nel motore di generazione, è iniziato subito dopo la creazione dei CAPTCHA.[13] Nel 2013, i ricercatori della Vicarious (ditta dedicata allo sviluppo di intelligenza artificiale) hanno annunciato di aver creato un sistema per risolvere le sfide CAPTCHA di Google, Yahoo!, e PayPal fino al 90% delle volte.[14] Nel 2014, gli ingegneri di Google hanno dimostrato un sistema in grado di sconfiggere le sfide CAPTCHA con una precisione del 99,8%.[15]

Test Hutter Prize[modifica | modifica wikitesto]

Gli organizzatori del premio Hutter credono che la compressione del testo in linguaggio naturale sia un problema di intelligenza artificiale, equivalente al superamento del test di Turing.[16] Il test di compressione dei dati presenta alcuni vantaggi rispetto alla maggior parte delle versioni e delle varianti di un test di Turing. Infatti questo test fornisce un singolo valore che può essere utilizzato direttamente per confrontare quale delle due macchine è "più intelligente"; inoltre non richiede al computer di mentire all'osservatore giudice I principali svantaggi d'altronde sono che non è possibile testare gli umani in questo modo e non si sa quale particolare "punteggio" ottenuto al test (se mai esiste) sia equivalente al superamento di un test di Turing da parte di un umano.

Altri test basati sulla compressione o sulla complessità di Kolmogorov[modifica | modifica wikitesto]

Alla fine degli anni '90 del XX secolo viene proposto un approccio, apparso molto prima, ma correlato al suddetto premio Hutter. Si tratta dell'inclusione di problemi di compressione in un test di Turing esteso.[17] Altri protocolli agiscono tramite prove che derivano completamente dalla complessità di Kolmogorov.[18] Alcuni test su questa linea sono presentati da Hernandez-Orallo e Dowe.[19] L'Algorithmic IQ, o AIQ, è invece un tentativo di convertire la misura di Intelligenza Universale teorizzata da Legg e Hutter (basata sull'inferenza induttiva di Solomonoff) in un test pratico di intelligenza artificiale.[20] I due principali vantaggi di alcuni di questi test sono la loro applicabilità alle intelligenze non umane e la loro assenza di requisiti per i testatori umani.

Test Ebert[modifica | modifica wikitesto]

Il test di Turing ha ispirato il test Ebert proposto nel 2011 dal critico cinematografico Roger Ebert, che è un test se una voce sintetizzata basata su computer ha abilità sufficienti in termini di intonazioni, inflessioni, tempismo e così via, per far ridere la gente.[21]

Note[modifica | modifica wikitesto]

  1. ^ Alan M. Turing, Computing machinery and intelligence Archiviato il 2 luglio 2008 in Internet Archive., in Mind, 59, pp. 433-460, 1950. URL consultato il 12-12-2009.
  2. ^ Oppy, Graham & Dowe, David (2011) The Turing Test. Stanford Encyclopedia of Philosophy
  3. ^ Edd Gent, The Turing Test: brain-inspired computing's multiple-path approach, 2014.
  4. ^ McCorduck,  pp. 503–505, Feigenbaum.
  5. ^ Kurzweil, Ray (2005), The Singularity is Near, Penguin Books
  6. ^ https://dl.acm.org/citation.cfm?id=3176926.3168260
  7. ^ https://dl.acm.org/citation.cfm?id=3176926.3168260
  8. ^ http://tech.groups.yahoo.com/group/arcondev/message/337
  9. ^ Chris McKinstry, Minimum Intelligent Signal Test: An Alternative Turing Test, in Canadian Artificial Intelligence, nº 41, 1997.
  10. ^ Bion, W.S. (1979), "Making the best of a bad job", Clinical Seminars and Four Papers, Abingdon: Fleetwood Press.
  11. ^ Swirski, Peter (2000), Between Literature and Science: Poe, Lem, and Explorations in Aesthetics, Cognitive Science, and Literary Knowledge, McGill-Queen's University Press
  12. ^ Hinshelwood, R.D. (2001), Group Mentality and Having a Mind: Reflections on Bion's work on groups and on psychosis
  13. ^ Jitendra Malik e Greg Mori, Breaking a Visual CAPTCHA.
  14. ^ Pete Pachal, Captcha FAIL: Researchers Crack the Web's Most Popular Turing Test.
  15. ^ Liam Tung, Google algorithm busts CAPTCHA with 99.8 percent accuracy.
  16. ^ Tests of Machine Intelligence Shane Legg/Marcus Hutter - December 2007. http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.126.9552&rep=rep1&type=pdf
  17. ^ D L Dowe e A R Hajek, A computational extension to the Turing Test, in Proceedings of the 4th Conference of the Australasian Cognitive Science Society, 1997. URL consultato il 21 luglio 2009.
  18. ^ Jose Hernandez-Orallo, Beyond the Turing Test, in Journal of Logic, Language and Information, vol. 9, nº 4, 2000, pp. 447–466, DOI:10.1023/A:1008367325700. URL consultato il 21 luglio 2009.
  19. ^ Tests of Machine Intelligence Shane Legg/Marcus Hutter - December 2007. http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.126.9552&rep=rep1&type=pdf
  20. ^ Tests of Machine Intelligence Shane Legg/Marcus Hutter - December 2007. http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.126.9552&rep=rep1&type=pdf
  21. ^ Alex_Pasternack, A MacBook May Have Given Roger Ebert His Voice, But An iPod Saved His Life (Video), Motherboard, 18 aprile 2011. URL consultato il 12 settembre 2011.
    «He calls it the "Ebert Test," after Turing's AI standard...».

Voci correlate[modifica | modifica wikitesto]

Altri progetti[modifica | modifica wikitesto]

Collegamenti esterni[modifica | modifica wikitesto]

Controllo di autoritàGND (DE4770569-3
Informatica Portale Informatica: accedi alle voci di Wikipedia che trattano di informatica