GPT-4
| GPT-4 software | |
|---|---|
| Genere | Modello linguistico di grandi dimensioni (LLM) multimodale (non in lista) |
| Sviluppatore | OpenAI |
| Data prima versione | 14 marzo 2023 |
| Sistema operativo | Multipiattaforma (Cloud/API) (non in lista) |
| Linguaggio | Python |
| Licenza | Proprietaria (API a pagamento / ChatGPT Plus) (licenza non libera) |
| Sito web | openai.com/gpt-4 |
GPT-4 (Generative Pre-trained Transformer 4) è un modello linguistico di grandi dimensioni multimodale sviluppato da OpenAI[1][2], un laboratorio di ricerca sull'intelligenza artificiale con sede a San Francisco. È il quarto modello della serie GPT e successore di GPT-3.
Distribuito ufficialmente il 14 marzo 2023, GPT-4 rappresenta un significativo salto qualitativo rispetto ai predecessori grazie alla sua capacità di accettare input non solo testuali ma anche visivi (immagini), sebbene l'output rimanga testuale[3]. È accessibile tramite API a pagamento e per gli abbonati al servizio ChatGPT Plus, Team ed Enterprise[4][5], oltre ad essere il motore alla base di Microsoft Copilot (precedentemente Bing Chat).
Come altri "trasformatori", GPT-4 è stato pre-addestrato a prevedere il prossimo token in una sequenza utilizzando sia dati pubblici che "dati concessi in licenza da fornitori di terze parti", ed è stato poi perfezionato tramite l'apprendimento per rinforzo dal feedback umano (RLHF)[6].
Architettura e parametri
[modifica | modifica wikitesto]Sebbene OpenAI non abbia rilasciato dettagli tecnici ufficiali ("Closed Source"), citando ragioni di sicurezza e competitività, report tecnici indipendenti e fughe di notizie suggeriscono che GPT-4 utilizzi un'architettura Mixture of Experts (MoE). Si stima che il modello possa contare su un totale di circa 1,76 trilioni di parametri, suddivisi tra diversi "esperti" (sottomodelli) che vengono attivati in base alla complessità e alla tipologia del compito richiesto.[7]
Nell'aprile 2023 ha superato un test di informatica quantistica preparato da Scott Aaronson.[8]
Microsoft Copilot (ex Bing Chat)
[modifica | modifica wikitesto]Cinque settimane prima dell'annuncio ufficiale da parte di OpenAI, Microsoft Bing ha iniziato a sfruttare una versione preliminare di GPT-4 per la sua sezione Chat[9], inizialmente disponibile tramite lista d'attesa[10]. La conferma è giunta attraverso un post sul blog di Microsoft[11] firmato da Yusuf Mehdi, che dichiarava:
Siamo lieti di confermare che il nuovo Bing gira su GPT-4, che abbiamo personalizzato per la ricerca. Se avete usato l'anteprima del nuovo Bing in qualsiasi momento delle ultime cinque settimane, avete già sperimentato una prima versione di questo potente modello.
Successivamente, Microsoft ha integrato questa tecnologia nel suo ecosistema sotto il marchio Microsoft Copilot, rendendo GPT-4 accessibile gratuitamente (con alcune limitazioni) e in versione completa tramite abbonamento "Copilot Pro".
Differenze con GPT-3.5
[modifica | modifica wikitesto]La distinzione tra GPT-3.5 e GPT-4 può essere difficilmente notabile nelle conversazioni quotidiane semplici. Tuttavia, la differenza emerge chiaramente quando la complessità del compito aumenta: GPT-4 è più affidabile, creativo e in grado di gestire istruzioni molto più sfumate e complesse ("nuance") rispetto a GPT-3.5. Un'altra differenza sostanziale è la "finestra di contesto" (context window): mentre GPT-3.5 era limitato a circa 4.096 token, le prime versioni di GPT-4 supportavano fino a 8.192 e 32.768 token, permettendo l'analisi di documenti molto più lunghi.
GPT-4 è il primo modello di intelligenza artificiale ad aver superato entrambe le parti, a scelta multipla e scritta, dell'UBE (Uniform Bar Exam), con un punteggio superiore alla media degli esaminati reali, il che rappresenta una potente convalida delle sue capacità di ragionamento[12]. Nei test standardizzati, ha ottenuto punteggi circa 10 percentili più alti rispetto ai partecipanti umani e nettamente superiori a GPT-3.5[13][14].
Tabella dei benchmark
[modifica | modifica wikitesto]| Esami simulati | GPT-4 punteggio
|
GPT-4 (no vision)
|
GPT-3.5 punteggio
|
| Uniform Bar Exam (MBE+MEE+MPT) | 298 / 400
~90th |
298 / 400
~90th |
213 / 400
~10th |
| LSAT | 163
~88th |
161
~83rd |
149
~40th |
| SAT Evidence-Based Reading & Writing | 710 / 800
~93rd |
710 / 800
~93rd |
670 / 800
~87th |
| SAT Math | 700 / 800
~89th |
690 / 800
~89th |
590 / 800
~70th |
| Graduate Record Examination (GRE) Quantitative | 163 / 170
~80th |
157 / 170
~62nd |
147 / 170
~25th |
| Graduate Record Examination (GRE) Verbal | 169 / 170
~99th |
165 / 170
~96th |
154 / 170
~63rd |
| Graduate Record Examination (GRE) Writing | 4 / 6
~54th |
4 / 6
~54th |
4 / 6
~54th |
| USABO Semifinal Exam 2020 | 87 / 150
99th–100th |
87 / 150
99th–100th |
43 / 150
31st–33rd |
| USNCO Local Section Exam 2022 | 36 / 60 | 38 / 60 | 24 / 60 |
| Medical Knowledge Self-Assessment Program | 75% | 75% | 53% |
| Codeforces Rating | 392
sotto 5th |
392
sotto 5th |
260
sotto 5th |
| AP Art History | 586th–100th | 586th–100th | 586th–100th |
| AP Biology | 585th–100th | 585th–100th | 462nd–85th |
| AP Calculus BC | 443rd–59th | 443rd–59th | 10th–7th |
Versioni successive e varianti
[modifica | modifica wikitesto]Dopo la pubblicazione iniziale nel marzo 2023, OpenAI ha continuato a perfezionare il modello distribuendo diverse varianti ottimizzate per velocità, costo e capacità.
GPT-4 Turbo
[modifica | modifica wikitesto]Nel novembre 2023, durante la prima conferenza per sviluppatori di OpenAI (DevDay), è stato presentato GPT-4 Turbo. Questa versione offre una finestra di contesto significativamente ampliata a 128.000 token (equivalenti a circa 300 pagine di testo in un singolo prompt) e dispone di conoscenze aggiornate fino all'aprile 2023 (successivamente estese).[15] GPT-4 Turbo è stato ottimizzato per essere più economico per gli sviluppatori rispetto al modello GPT-4 originale.
GPT-4o (Omni)
[modifica | modifica wikitesto]Il 13 maggio 2024, OpenAI ha annunciato GPT-4o ("o" sta per "omni"). A differenza delle versioni precedenti che utilizzavano modelli separati per ascoltare (Whisper), vedere (Vision) e parlare (TTS), GPT-4o è un singolo modello "end-to-end" addestrato su testo, audio e immagini contemporaneamente. Questo gli permette di rispondere agli input audio in pochi millisecondi, con una latenza simile a quella umana, e di comprendere le intonazioni emotive.[16]
Capacità multimodali
[modifica | modifica wikitesto]A differenza delle versioni precedenti, GPT-4 (e in particolare le varianti GPT-4V e GPT-4o) può accettare un prompt di testo e immagini che, parallelamente all'impostazione di solo testo, consente all'utente di specificare qualsiasi compito di visione o di linguaggio. In particolare, genera output testuali (linguaggio naturale, codice, ecc.) con input costituiti da testo e immagini intercalati. In una serie di domini, tra cui documenti con testo e fotografie, diagrammi o schermate, GPT-4 mostra capacità simili a quelle degli input di solo testo[4][6].
Inizialmente, gli input di immagini erano un'anteprima di ricerca non disponibile al pubblico[17], ma nel settembre 2023 OpenAI ha distribuito la funzionalità "Vision" agli utenti Plus ed Enterprise, permettendo di analizzare foto, risolvere problemi matematici da immagini e descrivere scene complesse.
Inoltre, può essere potenziato con le tecniche di test-time sviluppate per i modelli linguistici di solo testo, tra cui il prompt di pochi colpi e la catena dei pensieri[18].
Sviluppo, costi e dataset
[modifica | modifica wikitesto]L'addestramento di GPT-4 è stato un'impresa ingegneristica massiccia, con costi stimati superiori ai 100 milioni di dollari.[19]
Riguardo ai dati di addestramento, OpenAI mantiene il massimo riserbo. Alcune fonti riportano che GPT-4 sia stato addestrato su dataset immensi. Una fonte specifica menziona che il modello sia stato addestrato su circa 570 GB di dati testuali (pari a circa 300 miliardi di parole)[20], sebbene questo dato sia spesso associato al dataset filtrato del predecessore GPT-3 ("Common Crawl"), mentre per GPT-4 stime non ufficiali parlano di svariati Petabyte di dati e trilioni di token di addestramento.
In un evento pubblico tenutosi al MIT, Sam Altman, amministratore delegato di OpenAI, ha chiarito che esistono limiti fisici allo sviluppo di nuovi datacenter e che gli sviluppi dell'IA dovranno concentrarsi sull'efficienza piuttosto che sull'incremento indiscriminato del numero di parametri gestiti.[21]
Sviluppi futuri e sicurezza
[modifica | modifica wikitesto]Secondo alcuni rumors circolati nel 2023, la fine dell'apprendimento per un ipotetico GPT-5 era prevista per dicembre 2023[22], sebbene OpenAI abbia successivamente smentito di essere al lavoro su un modello chiamato "GPT-5" in tempi brevi, concentrandosi invece sul miglioramento di GPT-4 (come avvenuto con GPT-4 Turbo e GPT-4o).
A fine luglio 2023 GPT-4 ha aperto all'uso da parte degli utenti a pagamento[23] e poi pubblicato l'API per la totalità degli sviluppatori.[24]
Stimando il rischio che l'intelligenza artificiale nei prossimi 10 anni superi l'intelligenza umana, OpenAI ha creato un team dedicato, denominato "Superalignment", col compito di controllarne lo sviluppo e garantire che i sistemi di IA super-intelligenti agiscano secondo gli interessi umani.[25]
Note
[modifica | modifica wikitesto]- ↑ HDblog.it, OpenAI lancia GPT-4, la nuova generazione del suo modello di linguaggio basato su IA, su HDblog.it, 15 marzo 2023. URL consultato il 15 marzo 2023.
- ↑ (EN) GPT-4, su openai.com. URL consultato il 15 marzo 2023.
- ↑ Michele Nasi, GPT-4: cosa c'è da sapere sul nuovo modello generativo di OpenAI, su IlSoftware.it, 15 marzo 2023. URL consultato il 15 marzo 2023.
- 1 2 (EN) Matt G. Southern, OpenAI Releases GPT-4: Now Available In ChatGPT & Bing, su Search Engine Journal, 14 marzo 2023. URL consultato il 15 marzo 2023.
- ↑ (EN) Mohammed Haddad, How does GPT-4 work and how can you start using it in ChatGPT?, su www.aljazeera.com. URL consultato il 15 marzo 2023.
- 1 2 (EN) OpenAI, GPT-4 Technical Report [Rapporto tecnico su GPT-4] (PDF), su openai.com.
- ↑ (EN) GPT-4 architecture, datasets, costs and more leaked, su The Decoder, 11 luglio 2023.
- ↑ ChatGPT supera brillantemente l'esame di quantum computing, su ilsoftware.it.
- ↑ (EN) Frederic Lardinois, Microsoft's new Bing was using GPT-4 all along, su TechCrunch, 14 marzo 2023. URL consultato il 15 marzo 2023.
- ↑ Presentazione del nuovo Bing, su www.bing.com. URL consultato il 15 marzo 2023.
- ↑ Confirmed: the new Bing runs on OpenAI’s GPT-4, su blogs.bing.com. URL consultato il 15 marzo 2023.
- ↑ (EN) CoCounsel is powered by OpenAI's GPT-4, the first AI to pass the bar - Casetext, su casetext.com, 14 marzo 2023. URL consultato il 15 marzo 2023.
- ↑ (EN) GPT-4, su openai.com. URL consultato il 15 marzo 2023.
- ↑ GPT-4 ha superato brillantemente alcuni esami, che miglioramenti dalla versione 3.5!, su Everyeye Tech. URL consultato il 15 marzo 2023.
- ↑ (EN) New models and developer products announced at DevDay, su OpenAI, 6 novembre 2023.
- ↑ (EN) Hello GPT-4o, su OpenAI, 13 maggio 2024.
- ↑ (EN) OpenAI's new GPT-4 can understand both text and image inputs, su Engadget. URL consultato il 15 marzo 2023.
- ↑ OpenAI lancia ChatGPT 4: il Large Language Model evolve ancora, 14 marzo 2023.
- ↑ Il capo di OpenAi pensa già all'evoluzione di ChatGpt, su wired.it.
- ↑ L'IA potrebbe divorare tutta la conoscenza scritta di Internet entro il 2026, su Everyeye Tech, 8 luglio 2024. URL consultato il 12 luglio 2024.
- ↑ CEO OpenAI sicuro: l'era dei grandi modelli IA è già finita, su punto-informatico.it.
- ↑ GPT-5 in arrivo entro fine 2023: scriverà testi come un essere umano?, su punto-informatico.it.
- ↑ OpenAI lancia il suo nuovo modello di intelligenza artificiale generativa, su wired.it, 7 luglio 2023.
- ↑ OpenAI, le API GPT-4 disponibili per tutti: perché è una notizia importante, su tech.everyeye.it.
- ↑ "IA più intelligente degli umani in arrivo in 10 anni": perché OpenAI corre ai ripari, su tech.everyeye.it.
Voci correlate
[modifica | modifica wikitesto]Collegamenti esterni
[modifica | modifica wikitesto]- (EN) Sito ufficiale, su openai.com.
- Pagina ufficiale di GPT-4 su OpenAI.com