Intel ha lanciato due importanti aggiornamenti per la sua infrastruttura IA: i processori Xeon 6 con P-core e gli acceleratori AI Gaudi 3. I primi sono progettati per carichi di lavoro ad alta intensità di calcolo, offrendo il doppio delle prestazioni rispetto alla generazione precedente. Presentano un maggior numero di core, una larghezza di banda della memoria raddoppiata, capacità di accelerazione AI integrate in ogni core e sono ottimizzati per le esigenze di prestazioni AI dall’edge al data center e agli ambienti cloud.

Gli acceleratori Gaudi 3 AI sono ottimizzati per l’IA generativa su larga scala. Dispongono di 64 core del processore Tensor (TPC) e otto motori di moltiplicazione di matrici (MME) per accelerare i calcoli delle reti neurali profonde. Includono 128 GB di memoria HBM2e e 24 porte Ethernet da 200 Gigabit per un networking scalabile, oltre a offrire compatibilità con il framework PyTorch e modelli avanzati Hugging Face.

Intel ha già annunciato una collaborazione con IBM per implementare gli acceleratori Gaudi 3 AI come servizio su IBM Cloud, mirando a ridurre il costo totale di proprietà (TCO) e migliorare le prestazioni. L’azienda sottolinea proprio i vantaggi in termini di TCO dei suoi sistemi AI, evidenziando che il 73% dei server accelerati GPU utilizza Intel Xeon come CPU host.

Per affrontare le sfide nel passaggio dai prototipi ai sistemi di produzione per l’IA generativa, Intel sta co-ingegnerizzando soluzioni RAG pronte per la produzione. Queste soluzioni, basate sulla piattaforma Open Platform Enterprise AI (OPEA), integrano microservizi OPEA in un sistema RAG scalabile e ottimizzato proprio per i sistemi AI Xeon e Gaudi.

screenshot-www.intel.com-2024.09.26-12_02_38

Intel sta anche espandendo l’accesso alle applicazioni IA enterprise attraverso il suo portfolio Tiber. L’Intel Tiber Developer Cloud ora offre sistemi di anteprima di Intel Xeon 6 per valutazioni tecniche e test e alcuni clienti selezionati avranno accesso anticipato a Intel Gaudi 3 per validare le implementazioni di modelli AI, con cluster Gaudi 3 che inizieranno a essere implementati il prossimo trimestre per distribuzioni di produzione su larga scala.