Microsoft lavora su MAI-1, un LLM che può competere con GPT-4 e Gemini
Secondo quanto riportato da The Information, Microsoft sta lavorando a un nuovo modello linguistico di IA su larga scala chiamato MAI-1, che potrebbe potenzialmente rivaleggiare con i modelli di Google, Anthropic e OpenAI. È la prima volta che Microsoft sviluppa internamente un modello di IA di questa portata dopo aver investito oltre 10 miliardi di dollari in OpenAI, il cui GPT-4 alimenta non solo ChatGPT ma anche Microsoft Copilot.
Lo sviluppo di MAI-1 è guidato da Mustafa Suleyman, l’ex leader di Google AI che di recente ha ricoperto il ruolo di CEO della startup Inflection prima che due mesi fa Microsoft ne acquisisse la maggior parte del personale e della proprietà intellettuale per 650 milioni di dollari. MAI-1 potrebbe quindi basarsi su quanto fatto in precedenza da Inflection, ma secondo due dipendenti Microsoft che hanno familiarità con il progetto si tratterebbe di un LLM completamente nuovo.
Con circa 500 miliardi di parametri, MAI-1 sarà significativamente più grande dei precedenti modelli open source di Microsoft come Phi-3, attestandosi su un livello simile a quello di GPT-4 e ben al di sopra di modelli più piccoli come quelli di Meta e Mistral, che hanno 70 miliardi di parametri.
Lo sviluppo di MAI-1 suggerisce due aspetti
- Un duplice approccio all’IA da parte di Microsoft (simile a quello adottato da Apple), che si concentra sia su piccoli modelli linguistici eseguiti localmente per i dispositivi mobili (il già citato Phi-3), sia su modelli più grandi e all’avanguardia alimentati dal cloud
- La volontà di Microsoft di esplorare lo sviluppo dell’IA indipendentemente da OpenAI
Secondo quanto riferito da The Information, lo scopo esatto di MAI-1 non è stato determinato (nemmeno all’interno di Microsoft) e il suo utilizzo ideale dipenderà dalle sue prestazioni, ma la cosa certa è che per addestrare il modello, Microsoft ha allocato un grande cluster di server con GPU Nvidia e ha compilato dati di addestramento provenienti da varie fonti, tra cui il testo generato da GPT-4 e dati pubblici di Internet.
In base ai progressi compiuti nelle prossime settimane, Microsoft potrebbe presentare l’anteprima di MAI-1 già alla conferenza degli sviluppatori Build, che si terrà dal 21 al 24 maggio.