“L’anno scorso, il mondo stava solo iniziando a immaginare come l’IA generativa avrebbe potuto trasformare le aziende. Oggi, questa trasformazione è ormai ampiamente avviata. Per Google, la missione ultima rimane sempre la stessa: rendere l’IA utile a tutti, per migliorare la vita del maggior numero possibile di persone”. Si è aperta con queste parole di Thomas Kurian (CEO di Google Cloud) la nuova edizione dell’evento Google Cloud Next, che mai come quest’anno (com’era prevedibile) ha visto primeggiare l’intelligenza artificiale.

Le novità annunciate nelle scorse ore da Google su questo versante sono davvero moltissime, anche perché l’odierna offerta IA complessiva di Google Cloud comprende infrastruttura, Gemini, modelli e Vertex AI, con i quali clienti e partner stanno creando agenti IA sempre più sofisticati al servizio dei loro clienti e a supporto dei dipendenti, per aiutarli a creare contenuti e molto altro ancora.

I nuovi agenti IA annunciati sono:

  • I Customer Agent possono aiutare i clienti a interagire con le aziende in modo più fluido lavorando su diversi canali (web, mobile, call center e punto vendita) e in più modalità, come testo, voce e altro
  • I Creative Agent possono affiancare designer e team di produzione, lavorando su immagini e presentazioni, e fornendo nuovi spunti. Canva utilizza ad esempio Vertex AI per il suo strumento Magic Design for Video, aiutando gli utenti a creare video coinvolgenti in pochi secondi, mentre Carrefour utilizza Vertex AI per creare campagne di marketing dinamiche su vari social network nel giro di settimane anziché mesi.

Infrastruttura nel segno di Nvidia

google cloud next

Spazio poi alle novità per l’infrastruttura IA, sulla quale Google sta facendo progressi fondamentali per supportare i clienti in tutti i livelli dello stack.

  • A3 mega: sviluppata con Nvidia utilizzando GPU Tensor Code H100, questa nuova istanza basata su GPU offre il doppio della larghezza di banda per GPU rispetto alle istanze A3 per supportare i carichi di lavoro più esigenti
  • Nvidia HGX B200 e Nvidia GB200 NVL72: i nuovi chip della piattaforma Nvidia Blackwell arriveranno su Google Cloud all’inizio del 2025 in due varianti: HGX B200 e GB200. B200 è progettato per il training e il servizio mainstream, mentre GB200 NVL72 abilita l’inferenza in tempo reale di modelli linguistici di grandi dimensioni e prestazioni di training su scala massiva per modelli da un trilione di parametri.
  • TPU v5p: Google ha annunciato la disponibilità di TPU v5p, il suo acceleratore IA più potente, scalabile e flessibile per il training e l’inferenza, con una potenza di calcolo per pod 4 volte superiore rispetto alla generazione precedente

Google sta inoltre abilitando l’intelligenza artificiale ovunque attraverso Google Distributed Cloud (GDC), le cui nuove funzionalità riguardano l’introduzione delle GPU Nvidia, l’abilitazione di una serie di modelli di intelligenza artificiale aperti, tra cui Gemma, Llama e altri ancora per l’esecuzione in ambienti edge, air-gapped e connessi.

LLM per tutte le esigenze

Sul versante Vertex AI, Google Cloud offre più di 130 modelli proprietari e di terze parti e sta espandendo l’accesso a una varietà di modelli in modo che i clienti abbiano la massima scelta nella selezione del modello:

  • Gemini 1.5 Pro: Gemini 1.5 Pro offre due dimensioni di finestre contestuali: 128K token e 1 milione di token ed è ora disponibile in anteprima pubblica. I clienti possono elaborare grandi quantità di informazioni in un unico flusso, tra cui 1 ora di video, 11 ore di audio, basi codice con oltre 30.000 linee di codice o oltre 700.000 parole
  • Claude 3: la nuova famiglia di modelli di Anthropic è ora generalmente disponibile per i clienti su Vertex AI
  • CodeGemma: Gemma è una famiglia di modelli leggeri e aperti realizzati con la stessa tecnologia utilizzata per creare i modelli Gemini. CodeGemma, una nuova versione ottimizzata di Gemma progettata per casi d’uso di codifica come la generazione di codice e l’assistenza al codice, è ora disponibile su Vertex AI
  • Imagen 2: La tecnologia text-to-image più avanzata di Google vanta una serie di funzioni di generazione di immagini per aiutare le aziende a creare immagini che corrispondano ai requisiti specifici del loro brand. La nuova funzionalità di text to live image consente ai team di marketing e creativi di generare immagini animate e gif, dotate di filtri di sicurezza e filigrane digitali
  • Digital Watermarking: abilitata da SynthID di Google DeepMind, la filigrana digitale è disponibile da oggi per le immagini prodotte da Imagen 2

L’IA generativa al servizio degli sviluppatori

1150740

Passando agli sviluppatori, Gemini Code Assist è la soluzione di Google per l’assistenza al codice IA orientata alle imprese. Per supportare gli sviluppatori, Google ha annunciato:

  • Gemini 1.5 Pro in Gemini Code Assist: questo aggiornamento offre un’enorme finestra contestuale da 1 milione di token, rivoluzionando il coding anche per i progetti più grandi. Secondo Google, Gemini Code Assist offre ora suggerimenti di codice ancora più accurati, insight più approfonditi e flussi di lavoro semplificati
  • Gemini Cloud Assist: fornisce assistenza IA per tutto il ciclo di vita dell’applicazione, facilitando la progettazione, la sicurezza, il funzionamento, la risoluzione dei problemi e l’ottimizzazione delle prestazioni e dei costi dell’applicazione.

“Abbiamo implementato Gemini Code Assist mettendolo a disposizione di un gruppo di sviluppatori all’interno di Google e abbiamo riscontrato un impatto significativo: una riduzione del 40% del tempo impiegato per il completamento delle attività di sviluppo più comuni e una diminuzione del 55% del tempo speso nella scrittura di nuovo codice. Gemini Code Assist supporta la base di codice privata ovunque: on premise, su GitHub, GitLab, Bitbucket o anche in più sedi”, ha dichiarato Kurian.

Dati aziendali al sicuro

1065532

Google Cloud permette inoltre di combinare il meglio dell’intelligenza artificiale con i dati aziendali, mantenendoli privati e protetti. Su questo versante le novità annunciate sono tre:

  • Gemini in BigQuery: utilizza l’intelligenza artificiale per aiutare i team che si occupano di dati a predisporre, scoprire, analizzare e gestire i dati. Inoltre, è possibile costruire ed eseguire pipeline di dati con il nuovo BigQuery Data Canvas, che offre una nuova esperienza simile a un blocco note con linguaggio naturale e visualizzazioni incorporate, entrambi disponibili in anteprima
  • Gemini in Database: facilita la migrazione in modo sicuro dei dati dai sistemi legacy, ad esempio convertendo il database in un database cloud moderno come AlloyDB
  • Gemini in Looker: nuove funzionalità, attualmente in anteprima, che consentono agli agenti di dati di integrarsi facilmente con i flussi di lavoro

Infine, oltre alla novità per Google Workspace di cui abbiamo parlato nel dettaglio qui, Kurian ha dedicato spazio alla sicurezza con funzionalità basate sull’IA generativa, con i Security Agent che forniscono assistenza in ogni fase del ciclo di vita della sicurezza. Le novità comprendono:

  • Gemini nella Threat Intelligence: utilizza il linguaggio naturale per fornire insight approfonditi sul comportamento degli attori delle minacce. Con Gemini, Google è in grado di analizzare campioni molto più grandi di codice potenzialmente dannosi. La finestra di contesto più ampia di Gemini permette di analizzare le interazioni tra i moduli, fornendo nuove informazioni sul vero intento del codice.
  • Gemini nelle Security Operation: la nuova funzione di ricerca assistita converte il linguaggio naturale in rilevamenti, riassume i dati relativi agli eventi, consiglia le azioni da intraprendere e guida gli utenti all’interno della piattaforma tramite una chat conversazionale