AMD Instinct MI300X: prime prestazioni MLPerf competitive con Nvidia H100

chip ia
AMD ha presentato i risultati dei primi benchmark MLPerf con le GPU AMD Instinct MI300X... e alcuni risultati sono sorprendenti.

AMD ha recentemente pubblicato i risultati dei benchmark MLPerf Inference per il suo acceleratore IA Instinct MI300X, che si è dimostrato competitivo con l’Nvidia H100 anche se solo su un singolo benchmark pur rimanendo indietro rispetto alla versione aggiornata H200 e al prossimo B200.

AMD ha condiviso solo i numeri di prestazione del MI300X nel benchmark MLPerf 4.1 per IA generativa sul modello Llama 2 70B. Un sistema con otto processori MI300X si è dimostrato leggermente più lento (23.512 token/secondo offline) rispetto a un sistema con otto processori Nvidia H100 SXM3 (24.323 token/secondo offline). Nel benchmark server più realistico, il sistema AMD MI300X è risultato invece leggermente più veloce: 21.028 token/secondo contro 20.605 token/secondo.

Ci sono però due aspetti importanti da considerare. Le prestazioni di picco del MI300X per l’IA sono 2,6 POPs, mentre quelle dell’H100 di Nvidia sono 1,98 FP8/INT8 TFLOPS/TOPS. Inoltre, il modulo H100 SXM3 di Nvidia ha 80GB di memoria HBM3 con una larghezza di banda di picco di 3,35 TB/s, mentre l’Instinct MI300X di AMD è dotato di 192GB di memoria HBM3 con una larghezza di banda di picco di 5,3 TB/s.

960x0

Questi fattori dovrebbero dare al MI300X di AMD un enorme vantaggio sull’H100 di Nvidia in termini di prestazioni, considerando che la capacità e la larghezza di banda della memoria giocano un ruolo cruciale nei carichi di lavoro di inferenza AI. Tuttavia, l’Instinct MI300X riesce a malapena a vincere nel benchmark di inferenza server e rimane indietro rispetto all’H100 nel benchmark di inferenza offline.

 

Sembra inoltre che l’MI300X non riesca a sfruttare appieno le sue capacità hardware, probabilmente a causa dello stack software; questo potrebbe spiegare perché AMD abbia evitato finora di mostrare risultati MLPerf. Il fatto che AMD abbia finalmente mostrato i risultati per GPU singole e in configurazione a 8 vie è comunque promettente, e l’essere competitivo con l’H100 di Nvidia è un risultato notevole.

amd mlperf

Se invece si parla di prestazioni tra l’MI300X e il più recente H200 di Nvidia, quest’ultimo è significativamente più veloce, principalmente grazie all’aumento della capacità e della larghezza di banda della memoria, mentre l’acceleratore di prossima generazione Nvidia B200 alza ulteriormente l’asticella.

Resta infine da vedere le performance complete di MLPerf 4.1 per l’MI300X che includano tutti e nove i benchmark standardizzati. Llama 2 70B è infatti solo uno di questi, con altri test come 3D Unet, BERT, DLRM, GPT-J, Mixtral, Resnet, Retinanet e Stable Diffusion XL che fanno parte della versione attuale.

Aziende:
Nvidia
Condividi:
 

NTT Data si espande nel Sud Italia: aperti due nuovi poli a Napoli e Cosenza

ntt data
NTT DATA ha annunciato un nuovo investimento in Italia per la costruzione del suo nuovo Polo a Cosenza, che vedrà occupate oltre 500 persone e che si rivela di importanza strategica per il Gruppo.

Si è tenuto a Tokyo, presso il Villaggio Italia, l’evento del MIMIT (Ministero delle Imprese e del Made in Italy) Invest in Italy: where innovating is tradition, nel quale sono state presentate le nuove opportunità di investimento in Italia e il nuovo Sportello Unico Invest in Italy, l’interfaccia singola per gli investitori esteri nel nostro Paese che li supporta in adempimenti e pratiche utili alla concreta realizzazione dell’investimento.

Ai lavori hanno partecipato diversi stakeholder giapponesi con importanti investimenti in Italia tra cui NTT DATA, mentre per la parte italiana sono stati presenti Valentino Valentini, Vice Ministro al MIMIT, Gianluigi Benedetti, Ambasciatore d’Italia in Giappone, Mario Vattani, Commissario Generale per l’Italia a Expo2025, e Amedeo Teti, Capo Dipartimento Imprese e Coordinatore dello Sportello Unico Attrazione Investimenti Esteri del Governo Italiano.

Un’ulteriore conferma di come le relazioni bilaterali tra Italia e Giappone si siano intensificate significativamente negli ultimi anni, con 557 investimenti diretti giapponesi in Italia che impiegano oltre 58.000 dipendenti e generano un fatturato complessivo di oltre 31 miliardi di euro.

valentini_tour

A margine dell’evento, NTT DATA ha annunciato un nuovo investimento in Italia per la costruzione del suo nuovo Polo a Cosenza, che vedrà occupate oltre 500 persone e che si rivela di importanza strategica per il Gruppo, poiché legato allo sviluppo delle attività in essere a supporto dei clienti e di un nuovo Lab sull’Intelligenza Artificiale strettamente connesso al progetto AI Metamorphosis, che ha l’obiettivo di guidare le aziende in un’evoluzione che impatta sull’intera organizzazione.

Da notare che il mese scorso NTT DATA Italia aveva lanciato a Napoli il Competence Center in Digital Linguistics & Human Behaviour, con l’obiettivo di unire competenze linguistiche e comportamentali per affrontare le sfide tecnologiche con una prospettiva umanistica. Il centro mira a sviluppare tecnologie più inclusive ed empatiche come l’IA per migliorare le interazioni uomo-macchina e anticipare i bisogni degli utenti.

Attualmente, il centro conta 50 persone e punta a raddoppiare nei prossimi due anni. I progetti spaziano dagli assistenti virtuali all’analisi automatizzata dei report di sostenibilità. NTT DATA Italia collabora inoltre con l’Università Orientale di Napoli per promuovere la ricerca e l’innovazione nella linguistica applicata e computazionale.

Condividi: