Oracle e Nvidia insieme per potenziare l’infrastruttura IA
Oracle ha annunciato che a breve saranno disponibili le nuove istanze di OCI (Oracle Cloud Infrastructure) Compute basate su GPU NVIDIA H100 Tensor Core, GPU NVIDIA L40S e sulle CPU Ampere AmpereOne. Le nuove istanze OCI Compute sono progettate per rendere più accessibile per le organizzazioni di tutto il mondo l’esecuzione di una varietà di carichi di lavoro in cloud (addestramento, messa a punto e inferenza di modelli IA, esecuzione di applicazioni cloud-native e applicazioni di transcodifica video), con in più un migliore rapporto prezzo-prestazioni.
Le istanze OCI Compute basate sulle GPU NVIDIA di nuova generazione sono:
- Istanze OCI Compute Bar Metal alimentate da GPU NVIDIA H100: aiuteranno i clienti a addestrare più velocemente modelli IA di grandi dimensioni, come quelli che alimentano i sistemi di elaborazione del linguaggio naturale e i sistemi di raccomandazione. Le organizzazioni che utilizzano GPU NVIDIA H100 Tensor Core hanno ottenuto un incremento delle prestazioni fino a 30 volte per i casi d’uso di inferenza IA e prestazioni 4 volte superiori per l’addestramento dei modelli IA rispetto a quanto avveniva con la precedente generazione di GPU NVIDIA A100 Tensor Core. Per i clienti che eseguono carichi di lavoro di elaborazione intensivi come l’addestramento dei modelli di IA, OCI Supercluster consente di collegare decine di migliaia di GPU NVIDIA H100 su una rete di cluster ad alte prestazioni e a bassissima latenza. Queste istanze saranno disponibili nelle Oracle Cloud Region di Londra e Chicago entro la fine del 2023 e a seguire poi in tutte le altre Cloud Region.
- Istanze OCI Compute Bare Metal basate su GPU NVIDIA L40S: rappresenteranno un’opzione alternativa per gestire carichi di lavoro quali l’inferenza IA o l’addestramento di modelli IA di piccole e medie dimensioni. Queste istanze sono state testate per offrire un miglioramento fino al +20% delle prestazioni per carichi di lavoro di IA generativa e un miglioramento fino al +70% dell’ottimizzazione rispetto alla generazione precedente di GPU NVIDIA A100. Si prevede che le istanze saranno disponibili entro il prossimo anno.
Le nuove istanze OCI Compute basate su CPU Ampere AmpereOne offriranno inoltre il miglior rapporto prezzo-prestazioni e il maggior numero di processori core disponibile nei rispettivi settori (320 core per le istanze Bare Metal e fino a 156 in forma di Virtual Machine flessibili). Potranno gestire una varietà di carichi di lavoro cloud di tipo generale, come l’esecuzione di web server, la transcodifica video e la gestione delle richieste di inferenza IA basate su CPU.
L’elevato numero di core disponibili in queste istanze permette di ottenere prestazioni più elevate, maggiore densità di virtual machine e più scalabilità, con lo scopo di aiutare i clienti a gestire in modo più efficiente i propri carichi di computing in data-center di più piccole dimensioni e tenendo sotto controllo il consumo energetico. Queste istanze possono eseguire anche forme flessibili per le virtual machine, così che i clienti possano regolare in modo granulare la quantità di memoria e la potenza di elaborazione da impiegare per ottimizzare l’uso delle risorse e ridurre al minimo i costi. Si prevede che queste istanze saranno disponibili entro il prossimo anno.