OpenAI lavora a una tecnologia per far ragionare i modelli IA
Secondo quanto riportato da Reuters, OpenAI starebbe sviluppando un nuovo modello di IA chiamato “Strawberry” per aiutare i suoi strumenti di intelligenza artificiale a raggiungere un’intelligenza di livello umano attraverso un ragionamento avanzato.
Strawberry, progetto di cui si conosce ancora pochissimo (pare che sia un segreto anche all’interno di OpenAI), scansionerebbe Internet in modo autonomo ed eseguirebbe in modo affidabile ciò che OpenAI descrive come “ricerca profonda”.
L’ambito in cui si muoverebbe Strawberry potrebbe riguardare qualsiasi cosa, dalla realizzazione di importanti scoperte scientifiche alla costruzione di nuove applicazioni software: “Vogliamo che i nostri modelli di IA vedano e comprendano il mondo più di quanto facciamo noi; la ricerca continua di nuove capacità di IA è una pratica comune nel settore e c’è la convinzione condivisa che questi sistemi miglioreranno il ragionamento nel tempo”, ha dichiarato a Reuters un portavoce di OpenAI.
Strawberry si propone di raggiungere questo obiettivo conducendo un’ampia analisi “post-training” dei modelli di IA esistenti di OpenAI per creare risposte più simili a quelle umane e, considerando che a inizio anno Sam Altman (CEO di OpenAI) aveva parlato proprio delle capacità di ragionamento come l’area di progresso più importante in ambito IA, questo nuovo progetto dell’azienda non rappresenta una vera e propria sorpresa.
Anzi, Strawberry si può considerare come un’estensione di Project Q* di OpenAI annunciato nel novembre 2023, che diversi esperti del settore hanno descritto come una svolta tecnica che consente lo sviluppo di modelli di intelligenza artificiale molto più potenti. Tra le capacità a cui OpenAI sta mirando con Strawberry c’è anche l’esecuzione di compiti a lungo termine (LHT), ovvero compiti complessi che richiedono a un modello di pianificare in anticipo e eseguire una serie di azioni su un periodo di tempo prolungato.
Altre aziende come Google, Meta e Microsoft stanno sperimentando diverse tecniche per migliorare il ragionamento nei modelli di IA, così come la maggior parte dei laboratori accademici che conducono ricerche sull’IA. Tuttavia, i ricercatori divergono sul fatto che i grandi modelli linguistici (LLM) siano in grado di integrare idee e pianificazione a lungo termine nel modo in cui effettuano previsioni.