Pure Storage FlashBlade//EXA vuole trasformare l’archiviazione per IA e HPC

Pure Storage ha presentato FlashBlade//EXA, una piattaforma di archiviazione ultra-scalabile progettata per supportare al meglio i carichi di lavoro AI e HPC. Questo nuovo sistema rappresenta un’evoluzione significativa rispetto ai modelli FlashBlade//S e FlashBlade//E, già riconosciuti per le loro capacità nel settore enterprise e classificati leader per quattro anni consecutivi nel Gartner Magic Quadrant per le piattaforme di storage a file e oggetti.
L’annuncio di Pure Storage arriva in uno scenario in cui, con la crescente diffusione dell’intelligenza artificiale, le aziende stanno integrando processi di training e inferenza nei loro flussi di lavoro, aumentando la domanda di risorse computazionali. Tuttavia, le infrastrutture tradizionali presentano limiti significativi nella scalabilità dello storage, nella gestione dei metadati e nell’efficienza operativa. Questi colli di bottiglia impediscono il pieno utilizzo delle GPU, rallentando i progressi e riducendo il ritorno sull’investimento.
Il problema diventa ancora più critico per i fornitori di cloud AI e i laboratori di ricerca, dove l’efficienza operativa è fondamentale per la redditività. I sistemi di storage parallelo tradizionali, ottimizzati per ambienti HPC prevedibili, faticano a gestire la complessità e la multimodalità dei flussi di lavoro AI su larga scala, che comprendono testi, immagini, video e altri formati da elaborare simultaneamente su migliaia di GPU.
Un nuovo approccio all’archiviazione AI
La crescita esponenziale dei dati ha inoltre evidenziato le carenze delle architetture di storage convenzionali, incapaci di gestire la scalabilità dei metadati senza compromettere le prestazioni. Gli approcci tradizionali, basati su accesso sequenziale, soffrono di rigidità e complessità, limitando la capacità di supportare carichi di lavoro paralleli ad alta intensità. Serve quindi un’architettura metadata-first, capace di scalare senza colli di bottiglia e supportare massiccia parallelizzazione.
FlashBlade//EXA introduce un nuovo paradigma nell’archiviazione per AI, basandosi su una struttura progettata per separare i metadati dai dati ed eliminando le inefficienze dei sistemi di file paralleli tradizionali. Questo approccio consente una gestione avanzata della concorrenza, evitando congestioni nei server di metadati e garantendo la consistenza su vasta scala. Inoltre, la piattaforma offre strumenti di gestione automatizzati per ottimizzare l’efficienza operativa.
Architettura e innovazioni tecnologiche
Pure Storage vanta una consolidata esperienza nel supportare clienti con casi d’uso ad alte prestazioni. Dal lancio di AIRI nel 2018, ha continuato a innovare con certificazioni per NVIDIA DGX SuperPOD e DGX BasePOD, oltre a soluzioni turnkey come GenAI Pods. FlashBlade ha già dimostrato il suo valore in aziende come Meta, aiutandole a scalare i carichi AI in modo efficiente.
FlashBlade//EXA, che sarà disponibile in estate, sfrutta un core di metadati distribuito basato su un database transazionale avanzato e tecnologia key-value store, garantendo disponibilità elevata e scalabilità efficiente. Ciò consente di superare le sfide di metadati su larga scala, affrontando problemi di concorrenza, prevenzione di hotspot e gestione gerarchica avanzata.
La piattaforma introduce anche un’architettura di archiviazione disaggregata, in cui l’I/O ad alta velocità viene separato in due elementi chiave:
- Array FlashBlade: responsabile della gestione dei metadati con un database distribuito scalabile
- Nodi di dati di terze parti: server standard con SSD NVMe che memorizzano i blocchi di dati, accessibili ad alta velocità tramite RDMA su protocolli di rete standard
Questa separazione elimina i colli di bottiglia legati all’accesso ai dati e consente una scalabilità esponenziale, ideale per scenari HPC avanzati.
Vantaggi dell’uso di server e SSD Off-The-Shelf
Le aziende con infrastrutture basate su server 1U e 2U con SSD possono integrare FlashBlade//EXA riducendo i costi e massimizzando il valore degli investimenti esistenti. Il cuore della piattaforma è il software Purity, progettato per adattarsi a nuove esigenze senza vincoli hardware proprietari. Questo approccio garantisce flessibilità nel tempo e facilita l’evoluzione delle infrastrutture AI.
FlashBlade//EXA semplifica anche la gestione dello storage su larga scala sia instradando i nodi di calcolo ai corrispondenti nodi dati, sia utilizzando un sistema operativo Linux leggero per garantire prestazioni elevate e compatibilità. Utilizza inoltre un’architettura di rete BGP per instradare il traffico tra metadati, dati e client di carico di lavoro evitando colli di bottiglia.
“FlashBlade//EXA utilizza un’architettura a parallelismo massivo che consente di scalare dati e metadati indipendentemente tra loro fornendo livelli ineguagliati di prestazioni, scalabilità e adattabilità per alcuni dei più estesi e complessi ambienti dati del mondo. Lo storage sta finalmente accelerando il ritmo dell’evoluzione di HPC e AI su vasta scala” ha dichiarato Rob Lee, Chief Technology Officer di Pure Storage.