Anche Meta ha il proprio chip per i carichi di lavoro IA
“Stiamo realizzando un piano ambizioso per costruire la prossima generazione dell’infrastruttura IA di Meta e oggi vogliamo condividere alcuni dettagli sui nostri progressi. Tra questi, il nostro primo chip personalizzato per l’esecuzione di modelli di IA, un nuovo design di data center ottimizzato per l’IA e la seconda fase del nostro supercomputer da 16.000 GPU per la ricerca sull’IA”.
Così ha scritto nei giorni scorsi Santosh Janardhan, responsabile dell’infrastruttura di Meta, in un post sul blog dell’azienda. Il chip personalizzato di Meta per l’esecuzione di modelli di intelligenza artificiale, chiamato Meta Training and Inference Accelerator (MTIA), è stato progettato per fornire una maggiore potenza di calcolo ed efficienza rispetto alle CPU attualmente in commercio.
Janardhan ha precisato che MTIA, la cui prima versione risale al 2020, è stato ottimizzato per carichi di lavoro interni come la comprensione dei contenuti, i feed, l’IA generativa e il ranking degli annunci. Ovviamente, questo di Meta non è il primo annuncio di un chip realizzato in ottica IA. Recentemente infatti è emerso che Microsoft sta collaborando AMD per sviluppare un proprio chip per l’esecuzione di carichi di lavoro in ambito IA e anche AWS ha proposto il proprio chip per l’esecuzione di carichi di lavoro IA.
Per quanto riguarda i data center, il nuovo design annunciato da Janardhan sarà ottimizzato per l’addestramento dei modelli IA. “Questo nuovo data center avrà una progettazione ottimizzata per l’IA e supporterà hardware per l’IA raffreddato a liquido e una rete di IA ad alte prestazioni che collegherà tra loro migliaia di chip di IA per cluster di addestramento dell’IA a livello di data center. I nuovi sistemi data center saranno più veloci ed economici da costruire rispetto alle strutture precedenti”.
Meta ha anche dichiarato di essere al lavoro sullo sviluppo di supercomputer IA che supporteranno l’addestramento di modelli AI di prossima generazione, alimenteranno strumenti di realtà aumentata e supporteranno la tecnologia di traduzione in tempo reale, sebbene su questo versante Janardhan non abbia rivelato ulteriori dettagli.