Grok 3 di xAI sfida i modelli di OpenAI e DeepSeek

Grok 3, la nuova versione del LLM di xAI, è realtà ed Elon Musk lo ha trionfalmente descritto come “un’IA orientata alla ricerca della verità, anche quando questa può risultare politicamente scorretta”. Un’innovazione chiave di Grok 3 è la funzione DeepSearch, che combina ricerca web e ragionamento avanzato per analizzare informazioni da più fonti. Include inoltre modalità specializzate per la risoluzione di problemi complessi, come Think, che mostra il processo logico seguito, e Big Brain, che dedica più potenza computazionale ai compiti più difficili.
Il pre-training del modello è stato completato all’inizio di gennaio, ma il team di xAI ha sottolineato che il processo di addestramento affidato a un enorme data center a Memphis con 200.000 GPU NVIDIA è ancora in corso. Sebbene il numero di GPU sia impressionante, resta inferiore a quello delle infrastrutture dei principali concorrenti come Google e OpenAI.
Secondo quanto sostenuto da xAI, Grok 3 è superiore alla concorrenza in alcuni benchmark, in particolare per le prestazioni in matematica (AIME ’24), ragionamento scientifico (GPQA) e programmazione (LCB). Secondo l’ex ricercatore di OpenAI Andrej Karpathy, il nuovo chatbot mostra in effetti capacità di pensiero all’avanguardia, al pari dei migliori modelli di OpenAI e superiori a quelli di DeepSeek e Gemini 2.0. Merito soprattutto dell’aumento della potenza di calcolo impiegata nello sviluppo di Grok 3, che secondo Musk ammonta a 15 volte rispetto allo sviluppo di Grok 2.
Nel suo post su X però, Karpathy ha evidenziato che il modello può inventare citazioni e fatica con l’umorismo e il ragionamento etico, problematiche comuni tra le IA attuali. Nonostante ciò, Grok 3 è stato elogiato da altri esperti del settore tra cui Alexandr Wang di Scale.ai, che lo ha definito “il miglior modello IA al mondo”.
Nella presentazione di ieri che vi riproponiamo nel video qui sopra, Musk e tre membri del team di xAI hanno mostrato Grok 3 all’opera sia con la creazione di un videogioco in stile Tetris generato in pochi secondi e perfettamente giocabile, sia con la generazione di una traiettoria di viaggio di andata e ritorno verso Marte con tanto di animazioni dettagliate. Nulla di veramente rivoluzionario a dire il vero, ma se non altro si è capita chiaramente la rapidità con cui xAI sta evolvendo il proprio modello.
Un ulteriore elemento distintivo è la futura apertura del codice sorgente di Grok 2, che diventerà open-source una volta che Grok 3 sarà considerato maturo e stabile. Gli abbonati al piano Premium+ di X, che in Italia costa circa 270 euro all’anno, saranno i primi ad accedere non solo alla nuova versione del chatbot, che però, secondo Musk, è da considerarsi al momento più una beta che un prodotto finito. Altri miglioramenti arriveranno nei prossimi mesi, tra cui l’integrazione del modello Grok 3 nell’API aziendale di xAI, l’interazione vocale e l’implementazione di una memoria per le conversazioni.
Nonostante la sua capacità di interrogare il web per rispondere alle domande, Grok 3, che al momento non è disponibile in Europa, non rappresenta ancora una minaccia diretta per i principali concorrenti, che probabilmente reagiranno con benchmark propri per dimostrarne la superiorità. Tuttavia, il ritmo di sviluppo resta un elemento chiave e anche in un settore in rapida evoluzione come l’IA, la velocità con cui xAI ha lanciato Grok 3 e migliorato il modello precedente è notevole.
(Foto di apertura: Primakov / Shutterstock).