No, OpenAI non ha lanciato un motore di ricerca, come erroneamente anticipato da qualcuno ma poi smentito da Sam Altman in persona, ma gli annunci di ieri sono comunque qualcosa che sposta ancor più in là l’asticella di quel che bisogna attendersi dalla nuova generazione di assistenti virtuali: più velocità, più interazione, maggior percezione del mondo in tempo reale e una maggiore empatia, qualsiasi cosa questo significhi quando si parla di algoritmi.

Il nuovo modello di punta GPT 4o, annunciato dalla CTO Mira Murati nel corso dello Spring Update ha prestazioni qualitative tutto sommato equivalenti a quelle di GPT 4 per quel che riguarda la generazione di testo, il ragionamento e la scrittura di codice, e migliora le capacità di analisi di audio e video e la generazione di testo in lingue diverse. In una delle demo fatte durante la presentazione, che trovate qui sotto, l’app mobile viene usata come interprete vocale tra inglese italiano. Una traduzione non simultanea, ma sicuramente molto fluida ed efficace.

Quel che cambia è soprattutto l’efficienza: è molto più veloce e più economico da eseguire, in termini di risorse di calcolo. La velocità permette di avere interazioni più fluide, soprattutto quando si fa una chat vocale: domande e risposte si inanellano senza ritardi e con una velocità paragonabile a quella di due interlocutori umani. È anche possibile interrompere il chatbot per fare una precisazione o correggere la richiesta mentre sta rispondendo. Il minor costo di esecuzione consentirà di abbassare i prezzi delle API e offrire il modello anche agli utenti gratuiti di ChatGPT.

Abbiamo bisogno davvero di un modello AI empatico?

Se questo non bastasse a rendere l’interazione  molto simile a quella tra due umani, Open AI ha fatto dei progressi anche nelle inflessioni della voce e nella capacità di aggiungere un’interpretazione quasi attoriale, potendo assumere di volta in volta un tono drammatico, rassicurante, simpatico o addirittura seducente, nel tono o nelle battute fatte, spingendo forse il modello un po’ troppo verso il territorio della Uncanny Valley, quella zona in cui un robot estremamente realistico finisce per suscitare negli uomini un sentimento perturbante.

Si aggiunga a questo il fatto che è stata migliorata la capacità di percepire e descrivere le emozioni del soggetto umano, analizzando respiro, tono di voce ed espressione facciale. Mirai ha ribadito che l’azienda lavora con governi e istituzioni per garantire che le sue tecnologie vengano rilasciate in modo responsabile e non dannoso per la società, ma le caratteristiche di empatia sembrano avvicinarsi molto a utilizzi potenzialmente dannosi.

La capacità di leggere le emozioni e interpretare una personalità seducente può essere usata da truffatori di ogni sorta per raggirare le persone, e qualcuno potrebbe anche finire con l’innamorarsi del modello, sviluppando una forma di dipendenza. Un fenomeno già sfruttato commercialmente da startup come Replika, che offre un servizio di “fidanzata virtuale”.

L’elevata velocità di funzionamento consente anche un’interazione immediata con l’ambiente, presentato attraverso immagini o video. L’app mobile può osservare il video ripreso dallo smartphone e commentarlo in tempo reale, fornendo per esempio istruzioni su come affrontare un problema matematico inquadrato dalla videocamera.

 

Un modello più efficiente e meno costoso

Oltre che per migliorare la velocità e l’immediatezza dell’interazione, la maggiore efficienza di GPT 4o significa anche che è possibile fornire il servizio a un numero maggiore di utenti a un costo più basso. Questo vale per chi utilizza le API a pagamento, e potrà quindi creare servizi con più utenti allo stesso prezzo, ma anche per OpenAI stessa, che prevede di dare accesso a GPT 4o anche agli utenti gratuiti nelle prossime settimane, seppure con qualche limitazione nel numero delle richieste.

Mirai ha affermato che rendere l’intelligenza artificiale accessibile al più vasto numero di persone è parte della missione fondativa di OpenAI, ma è indubbio che è necessario offrire anche agli utenti gratuiti e non registrati qualcosa in più per riuscire a tenere il passo con la concorrenza che ormai ha scaldato i suoi motori.

Grazie alla maggiore efficienza di GPT 4o, gli utenti gratuiti avranno accesso ad alcune funzionalità che finora erano state appannaggio degli abbonati al sevizio a pagamento ChatGPT Plus, come:

  • Intelligenza di livello GPT-4
  • Funzione Browse per avere risposte da contenuti web
  • Analizzare dati e creare diagrammi
  • Descrivere fotografie
  • Caricare file per ottenere analisi e riassunti
  • Utilizzare i GPTs personalizzati e il GPT Store
  • Memoria persistente della conversazione

Quel che da un paio di anni invece Open AI sembra non voler condividere sono le informazioni sul funzionamento dei suoi modelli, come il numero di parametri, i dataset utilizzati e informazioni sulla quantizzazione. Al momento non sono infatti disponibili paper o altre informazioni sulle modalità con cui è stato possibile aumentare in modo così drastico le prestazioni.

Se volete farvi un’idea del confronto con i principali modelli linguistici in circolazione, il sito Artificial Analysis ha aggiornato le sue classifiche di benchmark per includere GPT 4o.

Classifiche benchmark modelli IA

GPT 4o sarà gradualmnte disponibile come API, sulla versione web, nell’app mobile e in una nuova app Desktop (al momento solo per macOS) per gli utenti abbonati a ChatGPT Plus, e successivamente anche per gli utenti del servizio gratuito ChatGPT, con limitazioni nelle funzionalità e nel numero di interrogazioni.