Secondo quanto riportato da The Information, Google potrebbe presentare in anteprima la propria interpretazione del concetto di grande modello d’azione in stile Rabbit già a dicembre. Project Jarvis (questo il nome in codice del progetto di Google) dovrebbe svolgere compiti avanzati per gli utenti, tra cui raccogliere ricerche, acquistare un prodotto o prenotare un volo grazie a una futura versione di Gemini.

Jarvis funzionerebbe solo con un browser web (è stato messo a punto specificamente per Chrome) e ha lo scopo di aiutare le persone ad automatizzare le attività quotidiane basate sul web, analizzando e interpretando le schermate del browser e cliccando su pulsanti o inserendo testo. Allo stato attuale, sembra che queste azioni richiedano pochi secondi.

google jarvis

Le principali aziende di IA stanno tutte lavorando a modelli che fanno cose simili a quelle descritte da The Information. Copilot Vision di Microsoft permetterà ad esempio di parlare con l’agente IA delle pagine web che si stanno visualizzando, mentre il prossimo anno Apple Intelligence dovrebbe essere consapevole di ciò che si trova sullo schermo e fare cose in più app.

Anthropic ha presentato un aggiornamento beta di Claude in grado di utilizzare un computer al nostro posto e, secondo quanto riferito, anche OpenAI sta lavorando a una versione di questo sistema. The Information precisa che il piano di Google di mostrare Jarvis a dicembre è soggetto a cambiamenti e che la grande G starebbe pensando di rilasciarlo a un numero ristretto di tester per individuare e aiutare l’azienda a risolvere i bug.