IA in azienda: come sfruttare al meglio MLOps
Quando le aziende iniziano a implementare l’intelligenza artificiale (IA) e a creare progetti di machine learning (ML), l’attenzione tende a concentrarsi sulla teoria. Esiste un modello in grado di fornire i risultati necessari? Come può essere costruito? Come può essere addestrato?
Gli strumenti che i data scientist utilizzano per creare queste prove di concetto spesso non si traducono bene nei sistemi di produzione. Di conseguenza, secondo i dati di IDC, possono essere necessari in media più di nove mesi per implementare una soluzione di intelligenza artificiale o ML.
“La chiamiamo velocità del modello, ovvero quanto tempo ci vuole dall’inizio alla fine”, afferma l’analista di IDC Sriram Subramanian. È qui che entra in gioco MLOps, un insieme di best practice, framework e strumenti che aiutano le aziende a gestire dati, modelli, implementazione, monitoraggio e altri aspetti dell’adozione di un sistema di intelligenza artificiale proof-of-concept teorico.
“MLops riduce la velocità del modello a settimane, a volte giorni”, continua Subramanian. “Proprio come il tempo medio per creare un’applicazione viene accelerato con DevOps, lo stesso succede con MLOps in ambito IA e machine learning.” Adottando MLOps, le aziende possono costruire più modelli, innovare più velocemente e affrontare più casi d’uso.
IDC prevede che entro il 2024 il 60% delle aziende avrà reso operativi i propri flussi di lavoro ML utilizzando MLOps. E quando le aziende sono state intervistate sulle sfide dell’adozione di IA e ML, la mancanza di MLOps è stato un ostacolo importante secondo solo ai costi.
In questo articolo vogliamo capire cosa sia il MLOP, come si sia evoluto e ciò che le organizzazioni devono realizzare e tenere a mente per sfruttare al meglio questa metodologia emergente per rendere operativa l’IA in azienda.
L’evoluzione di MLOps
Quando Eugenio Zuccarelli ha iniziato a creare progetti di machine learning diversi anni fa, MLOps era solo un insieme di best practice. Da allora, Zuccarelli ha lavorato a progetti di intelligenza artificiale in diverse aziende e ha visto MLOps evolversi nel tempo. Oggi, MLOps offre un framework abbastanza solido per rendere operativa l’IA, afferma Zuccarelli, attualmente data scientist presso CVS Health. A titolo di esempio, Zuccarelli indica un progetto su cui ha lavorato in precedenza per creare un’app che prevedesse esiti avversi come la riammissione in ospedale o la progressione di una malattia.
“Esploravamo set di dati e modelli e parlavamo con i medici per scoprire le caratteristiche dei migliori modelli”, afferma. “Ma per rendere questi modelli effettivamente utili, dovevamo portarli di fronte agli utenti reali”. Ciò significava creare un’app mobile affidabile, veloce e stabile, con un sistema di machine learning sul back-end connesso tramite API. “Senza MLOps non saremmo stati in grado di raggiungere il risultato che ci eravamo prefissi.
Il suo team ha utilizzato la piattaforma H2O MLOps e altri strumenti per creare una dashboard sanitaria per il modello. L’utilizzo di una piattaforma MLOps ha consentito anche l’aggiornamento dei sistemi di produzione. “Gli strumenti MLOps possono sostituire un sistema anche se è in produzione con un’interruzione minima del sistema stesso”.
Man mano che le piattaforme MLOps maturano, accelerano l’intero processo di sviluppo del modello perché le aziende non devono ripartire da zero con ogni progetto. E anche la funzionalità di gestione della pipeline di dati è fondamentale per rendere operativa l’IA.
“Se abbiamo più origini dati che devono comunicare tra loro, è qui che può entrare in gioco MLOps. Vogliamo che tutti i dati che fluiscono nei modelli ML siano coerenti e di alta qualità. Se il modello ha informazioni di scarsa qualità, la previsione stessa sarà di scarsa qualità”.
Fondamenti di MLOps: un bersaglio mobile
Non pensiate però di poter ignorare i principi fondamentali di MLOps solo perché le piattaforme e gli strumenti stanno diventando disponibili su larga scala. Le aziende che stanno iniziando a passare a questa disciplina dovrebbero tenere a mente che la base di MLOps riguarda la creazione di forti connessioni tra data science e data engineering.
“Per garantire il successo di un progetto MLOps, sono necessari data engineer e data scientist nello stesso team”, afferma Zuccarelli. “Inoltre, gli strumenti necessari per proteggere il modello dai pregiudizi, per garantire trasparenza, per fornire spiegazioni e per supportare piattaforme etiche sono ancora in fase di costruzione. C’è ancora molto lavoro da fare, anche perché parliamo di una disciplina ancora estremamente giovane”.
Quindi, senza una soluzione chiavi in mano completa da adottare, le aziende devono essere esperte in tutti gli aspetti che rende MLOps così efficace nell’operatività dell’IA. E questo significa sviluppare competenze in un’ampia gamma di attività, afferma Meagan Gentry, National Practice Manager per il team IA di Insight, una società di consulenza tecnologica con sede a Tempe, Arizona.
MLOps copre l’intera gamma dalla raccolta, verifica e analisi dei dati fino alla gestione delle risorse della macchina e al monitoraggio delle prestazioni del modello. Gli strumenti disponibili per aiutare le aziende possono essere implementati in locale, nel cloud o nell’edge ed essere open source o proprietari. Ma padroneggiare gli aspetti tecnici è solo una parte dell’equazione. MLOps prende in prestito da DevOps anche una metodologia agile e il principio dello sviluppo iterativo e, come per qualsiasi disciplina relativa all’agile, anche in questo caso la comunicazione è fondamentale.
“La comunicazione in ogni ruolo è fondamentale”, afferma Gentry. “Comunicazione tra il data scientist e il data engineer. Comunicazione con i DevOps e con il team IT”. Per le aziende che hanno appena iniziato, MLOps può creare confusione. Esistono principi generali, dozzine di fornitori e set di strumenti open source ancora più numerosi. “È qui che entrano in gioco le insidie” afferma Helen Ristov, senior manager dell’architettura aziendale di Capgemini Americas. “Quando parliamo di MLOps, parliamo di una disciplina ancora in fase di sviluppo. Non esiste una serie formale di linee guida come quelle che conosciamo per DevOps. È una tecnologia nascente e ci vorrà tempo prima di vedere linee guida e policy chiare e valide per tutti”.
Ristov consiglia alle aziende di iniziare il loro percorso in ambito MLOps con le loro piattaforme dati. Le aziende non hanno bisogno di spostare tutti i loro dati su un’unica piattaforma, ma deve esserci un modo per importare dati da origini dati disparate e questo può variare in base all’applicazione. I data lake funzionano bene per le aziende che eseguono molte analisi ad alta frequenza e che sono alla ricerca di storage a basso costo.
Le piattaforme MLOps generalmente sono dotate di strumenti per costruire e gestire pipeline di dati e tenere traccia delle diverse versioni dei dati di addestramento, ma non è così facile e automatico. E poi ci sono da considerare anche la creazione del modello, il controllo delle versioni, la registrazione e altri aspetti della gestione dei modelli stessi.
Ecco perché la configurazione di una piattaforma MLOps può richiedere mesi e perché i fornitori di piattaforme hanno ancora molto lavoro da fare quando si tratta di integrazione. “Ci sono molti strumenti in fase di sviluppo, l’ecosistema è molto grande e le persone scelgono solo ciò di cui hanno bisogno. MLOps è in una fase “adolescenziale” e la maggior parte delle organizzazioni sta ancora cercando configurazioni ottimali”, continua Ristov.
Dare un senso a MLOps
Si prevede che il mercato MLOps crescerà fino a circa 700 milioni di dollari entro il 2025, rispetto ai circa 185 milioni nel 2020. Ma questa è probabilmente una stima al ribasso dal momento che i prodotti MLOps sono spesso in bundle con piattaforme più grandi. La vera dimensione del mercato, afferma Subramanian di IDC, potrebbe superare i 2 miliardi di dollari entro il 2025.
I fornitori di MLOps tendono a rientrare in tre categorie a partire dai grandi fornitori cloud (AWS, Azure e Google cloud), che forniscono funzionalità MLOps come servizio. Ci sono poi fornitori di piattaforme ML come DataRobot, Dataiku e Iguazio, mentre la terza categoria è quella dei fornitori di gestione dei dati come Cloudera, SAS e DataBricks. Il loro punto di forza erano le capacità di gestione dei dati e le operazioni sui dati e si sono fino a inglobare funzionalità ML e, infine, funzionalità MLOps.
Tutte e tre le categorie stanno crescendo a ritmi “esplosivi”, afferma Subramanian, secondo cui ciò che distingue un fornitore MLOps da un altro consiste nel:
- Supportare modelli di distribuzione sia on-prem che su cloud
- Implementare un’IA affidabile e responsabile
- Essere plug-and-play
- Scalare con facilità
Secondo un recente sondaggio IDC, la mancanza di metodi per implementare un’IA responsabile è stato uno dei primi tre ostacoli all’adozione di IA e ML, con al secondo posto proprio la mancanza di MLOps. Ciò è in gran parte dovuto al fatto che non ci sono alternative all’adozione di MLOps, afferma Sumit Agarwal, analista di Gartner esperto in IA e ML.
“Gli altri approcci sono manuali. Quindi, non c’è davvero altra opzione. Se volete scalare, avete bisogno dell’automazione. È necessaria la tracciabilità del codice, dei dati e dei modelli”. Secondo un recente sondaggio Gartner, il tempo medio necessario per portare un modello IA dal proof of concept alla produzione è sceso da nove a 7,3 mesi. “Ma 7,3 mesi sono ancora tanti, troppi“, afferma Agarwal. “Ci sono molte opportunità per le organizzazioni di trarre vantaggio da MLOps”.
Compiere il passaggio culturale a MLOps
MLOps richiede anche un cambiamento culturale da parte del team IA di un’azienda, afferma Amaresh Tripathy, leader globale dell’analisi presso Genpact. “L’immagine popolare di un data scientist è quella di uno scienziato pazzo che cerca di trovare un ago in un pagliaio. Il data scientist, in realtà, è uno scopritore e un esploratore, non una fabbrica che sforna widget“.
Le aziende inoltre non riescono a capire che MLOps può causare effetti a catena su altre parti dell’organizzazione, portando spesso a cambiamenti radicali. “Potete inserire MLOps in un call center e il tempo medio di risposta aumenterà effettivamente perché i compiti più semplici sono gestiti dall’IA, ma per questioni più complesse e articolate c’è ancora bisogna dell’intervento umano. Dovete quindi capire di quali persone avete bisogno e quali dovrebbero essere le loro competenze”.
Oggi, meno del 5% delle decisioni in un’organizzazione sono guidate da algoritmi, ma questo scenario sta cambiando rapidamente. “Prevediamo che il 20-25% delle decisioni sarà guidato da algoritmi nei prossimi cinque anni. Siamo a un punto di svolta nell’implementazione dell’IA e MLOps è un elemento chiave di questa rivoluzione. Senza MLOps non sarete in grado di implementare l’IA in modo coerente”, conclude Tripathy.