L’infrastruttura cloud sta attraversando una trasformazione radicale, guidata dalla corsa dei fornitori di servizi a implementare server configurati per l’addestramento di modelli IA. Questa tendenza sta spingendo molti provider a posticipare il consueto ciclo di aggiornamento dell’hardware server standard.

Secondo Vlad Galabov, responsabile della ricerca su cloud e data center presso Omdia, le spese in conto capitale per l’infrastruttura dei data center cloud dovrebbero aumentare del 30% quest’anno. Tuttavia, questa stima potrebbe essere già superata, poiché alcuni fornitori di servizi cloud hanno indicato la possibilità di aumentare ulteriormente le loro spese in conto capitale, raggiungendo livelli senza precedenti.

L’impatto dell’IA sull’infrastruttura è evidente nelle stime di Omdia, secondo cui i server IA rappresenteranno il 66% della spesa complessiva in server quest’anno. Galabov descrive questo fenomeno come “veramente straordinario” e “il più dirompente che abbiamo mai visto”. Questi investimenti su larga scala non provengono solo dai tre principali fornitori cloud (AWS, Azure e Google Cloud), ma includono anche i primi 10 fornitori di servizi cloud e un numero crescente di fornitori specializzati in IA, come CoreWeave.

Nonostante i server IA rappresentino il 66% della spesa attuale, costituiscono solo il 19% delle spedizioni totali di server. Questo divario sottolinea quanto siano costosi questi sistemi dotati di GPU. La crescita degli investimenti in sistemi IA solleva però la questione se questa spesa stia influenzando la capacità dei fornitori cloud di aggiornare la loro flotta di server esistente. Tuttavia, la situazione è più complessa, soprattutto considerando che i grandi operatori cloud hanno già investito miliardi in altri chip personalizzati per rendere le loro piattaforme più efficienti.

raffreddamento a liquido

Galabov spiega che i principali fornitori di servizi cloud stanno attivamente consolidando la loro infrastruttura server non-IA per ridurre i costi. Un esempio significativo è Google, che ha sviluppato un processore personalizzato chiamato Video Encoding Unit (VCU) per ottimizzare l’elaborazione video. Questo ha permesso all’azienda di sostituire diversi server con un singolo sistema altamente accelerato e ottimizzato.

Parallelamente, molte aziende stanno riconsiderando il loro approccio al cloud pubblico. Alcune stanno riportando alcuni carichi di lavoro in-house, un fenomeno noto come “cloud repatriation”. Questo è spesso dovuto alla scoperta che il consumo di risorse cloud pubbliche può essere costoso quanto, se non di più, della gestione di un’infrastruttura IT propria.

Galabov sottolinea che in futuro ci sarà probabilmente una maggiore attenzione al “right-sizing” e al posizionamento dei carichi di lavoro dove ha più senso, un approccio che Omdia definisce “cloud smart”. Nel prossimo futuro, Galabov prevede che le aziende si affideranno maggiormente a piattaforme IT-as-a-service come Dell Apex o HPE Greenlake per il loro calcolo in-house.

Nonostante queste tendenze, la spesa delle aziende per i servizi di infrastruttura cloud rimane forte, con un aumento del 21% a oltre 76 miliardi di dollari nel primo trimestre di quest’anno. Il 72% di questa spesa va ai tre principali operatori cloud, anche se i player cloud di secondo livello come Snowflake, MongoDB e Oracle hanno mostrato i tassi di crescita anno su anno più forti.