MLops e l'ascesa delle operazioni di machine learning

Per quanto sia difficile per i data scientist etichettare i dati e sviluppare modelli di machine learning accurati, la gestione dei modelli in produzione può essere ancora più scoraggiante. Riqualificare i modelli con l’aggiornamento dei set di dati, migliorare le prestazioni e mantenere le piattaforme tecnologiche sottostanti sono tutte pratiche importanti per la data science. Senza queste discipline, i modelli possono produrre risultati errati che hanno un impatto significativo (e in negativo) sul business.

Sviluppare modelli pronti per la produzione non è un’impresa facile. Secondo uno studio sul machine learning, il 55% delle aziende non aveva implementato modelli in produzione e il 40% o più richiedeva più di 30 giorni per implementare un modello. Il successo comporta nuove sfide e il 41% degli intervistati riconosce la difficoltà del controllo delle versioni dei modelli di machine learning e della riproducibilità.

La gestione e le operazioni dei modelli hanno rappresentato vere e proprie sfide per i team di data science più avanzati. Ora le attività includono il monitoraggio dei modelli di machine learning di produzione, l’automazione della riqualificazione dei modelli e il riconoscimento di quando i modelli richiedono aggiornamenti. Poiché sempre più organizzazioni investono nel machine learning, aumenta la necessità di creare consapevolezza sulla gestione e sulle operazioni dei modelli.

La buona notizia è che piattaforme e librerie open source come MLFlow e DVC e strumenti commerciali di Alteryx, Databricks, Dataiku, SAS, DataRobot, ModelOp e altri stanno semplificando la gestione dei modelli e le operazioni per i team di data science. Anche i provider di cloud pubblico condividono pratiche come l’implementazione di MLops con Azure Machine Learning. MLops è un termine che indica la gestione dei modelli di machine learning e comprende la cultura, le pratiche e le tecnologie necessarie per sviluppare e mantenere modelli di apprendimento automatico.

Comprensione della gestione e delle operazioni del modello

In qualità di sviluppatore di software, sapete che completare la versione di un’applicazione e distribuirla alla produzione non è affatto un processo banale. Ma una sfida ancora più grande inizia una volta che l’applicazione raggiunge la produzione. Gli utenti finali si aspettano miglioramenti regolari e l’infrastruttura, le piattaforme e le librerie sottostanti richiedono patch e manutenzione.

Passiamo ora al mondo scientifico, dove le domande portano a molteplici ipotesi e a sperimentazioni ripetitive. Durante la lezione di scienze avete imparato a tenere un registro di questi esperimenti e a tenere traccia del percorso di modifica di variabili diverse da un esperimento all’altro. La sperimentazione porta a risultati migliori e la documentazione del processo aiuta a convincere i colleghi che avete esplorato tutte le variabili e che i risultati sono riproducibili.

I data scientist che sperimentano modelli di machine learning devono incorporare discipline prese sia dallo sviluppo del software, sia dalla ricerca scientifica. I modelli di machine learning sono codice software sviluppato in linguaggi come Python e R, costruiti con TensorFlow, PyTorch o altre librerie di machine learning, eseguiti su piattaforme come Apache Spark e distribuiti nell’infrastruttura cloud. Lo sviluppo e il supporto di modelli di machine learning richiedono una sperimentazione e un’ottimizzazione significative e i data scientist devono dimostrare l’accuratezza dei loro modelli.

Come lo sviluppo del software, anche i modelli di machine learning richiedono una manutenzione e miglioramenti continui. Alcuni di questi derivano dalla manutenzione del codice, delle librerie, delle piattaforme e dell’infrastruttura, ma i data scientist devono anche preoccuparsi dal cosiddetto model drift. Questa “deriva” del modello si verifica quando nuovi dati diventano disponibili e le previsioni, i cluster, le segmentazioni e le raccomandazioni fornite dai modelli di apprendimento automatico si discostano dai risultati attesi.

Una gestione dei modelli di successo inizia con lo sviluppo di modelli ottimali
Secondo Alan Jacobson, chief data and analytics officer di Alteryx, “per semplificare lo sviluppo del modello, la prima sfida per la maggior parte dei data scientist è garantire una formulazione solida dei problemi. Molti problemi aziendali complessi possono essere risolti con analisi molto semplici, ma per prima cosa è necessario strutturare il problema in modo che i dati e l’analisi possano aiutare a rispondere alla domanda. Anche quando vengono utilizzati modelli complessi, la parte più difficile del processo è in genere la strutturazione dei dati e la garanzia che vengano utilizzati gli input giusti ai giusti livelli di qualità”.

Sono d’accordo con Jacobson. Troppi dati e implementazioni tecnologiche iniziano con convinzioni poco solide e con tempi, strumenti e competenze in materia inadeguati per garantire un’adeguata qualità dei dati. Le organizzazioni devono prima iniziare ponendo domande intelligenti sui big data, investendo in dataops e quindi utilizzando metodologie agili nella scienza dei dati.

Monitoraggio dei modelli di machine learning per il model drift

Ottenere una definizione precisa del problema è fondamentale per la gestione e il monitoraggio continui dei modelli in produzione. Jacobson ha continuato spiegando: “Il monitoraggio dei modelli è un processo importante, ma farlo bene richiede una forte comprensione degli obiettivi e dei potenziali effetti negativi che meritano di essere osservati. Mentre spesso si discute del monitoraggio delle prestazioni del modello e del cambiamento nel tempo, ciò che è più importante è l’analisi delle conseguenze non intenzionali.”

Un modo semplice per comprendere il model drift e le sue conseguenze indesiderate è considerare l’impatto del COVID-19 sui modelli di machine learning sviluppati con i dati di addestramento prima della pandemia. I modelli di apprendimento automatico basati su comportamenti umani, elaborazione del linguaggio naturale o modelli di domanda dei consumatori sono stati tutti influenzati dal cambiamento dei comportamenti durante la pandemia che stanno ora interferendo con i modelli di intelligenza artificiale.

I fornitori di tecnologia stanno rilasciando nuove funzionalità MLops poiché sempre più organizzazioni stanno potenziando i propri programmi di data science. Ad esempio, SAS ha introdotto un indice di contributo delle funzionalità che aiuta i data scientist a valutare i modelli senza una variabile di destinazione. Cloudera ha recentemente annunciato un servizio di monitoraggio ML che acquisisce le metriche delle prestazioni tecniche e tiene traccia delle previsioni del modello.

MLops si occupa anche di automazione e collaborazione

Tra lo sviluppo di un modello di machine learning e il suo monitoraggio in produzione ci sono strumenti, processi, collaborazioni e funzionalità aggiuntivi che consentono la scalabilità delle pratiche di data science. Alcune delle pratiche di automazione e infrastruttura sono analoghe a devops e includono l’infrastruttura come codice e CI/CD (integrazione continua/distribuzione continua) per i modelli di apprendimento automatico. Altri includono funzionalità per sviluppatori come il controllo delle versioni dei modelli con i training data sottostanti e la ricerca nel repository del modello.

Gli aspetti più interessanti di MLops portano la metodologia scientifica e la collaborazione ai team di data science. Ad esempio, DataRobot abilita un modello campione-sfidante che può eseguire più modelli sperimentali in parallelo per mettere alla prova l’accuratezza della versione di produzione. SAS vuole aiutare i data scientist a migliorare la qualità dei dati e Alteryx ha recentemente introdotto Analytics Hub per aiutare la collaborazione e la condivisione tra i team di data science.

Tutto ciò mostra che la gestione e lo scaling del machine learning richiedono molta più disciplina e pratica rispetto al semplice chiedere a un data scientist di codificare e testare algoritmi k-means o una rete neurale convoluzionale in Python.

Il vicepresidente senior di Apple per AI e Machine Learning, John Giannandrea, ha affermato che il machine learning trasformerà ogni parte dell’esperienza Apple nei prossimi anni. Che impatto potrebbe avere tutto ciò sulla vostra azienda?

Grammarly sul dispositivo?

Grammarly ha un valore inestimabile, ma l’unica cosa che non mi piace di esso (e una buona ragione per cui le aziende ne vietano l’uso) è il sospetto su ciò che accade a ciò che viene scritto mentre passa attraverso il sistema. Negli affari la privacy è essenziale, in particolare nei settori fortemente regolamentati. Immaginate un correttore grammaticale sul dispositivo che mantenga ciò che scrivete senza che il vostro lavoro esca dal dispositivo, a meno che non scegliate di condividerlo.

Questo è il tipo di servizio basato sull’intelligenza artificiale che Apple potrebbe fornire: una versione migliorata di ciò che offre già, ma sufficientemente privata e sicura per l’uso aziendale. Un controllo grammaticale efficace e pertinente sul dispositivo potrebbe diventare inestimabile, sebbene debba essere più configurabile dall’utente rispetto alla correzione automatica.

Aumentare le attività del flusso di lavoro

Naturalmente, una volta che pensate a una soluzione di potenziamento, diventa più facile considerarne altre. Pensate ad esempio alle attività ripetitive che fanno parte del vostro flusso di lavoro. Potreste aver già automatizzato gli elementi di queste, ma la promessa dell’intelligenza sul dispositivo indica articolazioni più efficaci con cui il vostro device potrebbe diventare il vostro “gemello digitale” che potenzia la produttività.

Sono convinto che Apple si stia già muovendo in questa direzione. I consigli di Siri sono il fiore all’occhiello di ciò, ma immaginate se questa intelligenza predittiva fosse applicata ad altri processi aziendali. Immaginate un’app Shortcuts selezionata automaticamente per fornire le competenze di produttività pertinenti utilizzate all’interno della vostra particolare azienda.

Aiuto per la gestione dei processi aziendali

Finora l’obiettivo è stato quello di consentire alle persone di concentrarsi meno su compiti ripetitivi a favore di sfide più complesse. È un’ottima cosa in termini di risultati individuali, ma la maggior parte delle aziende fa affidamento sui team. In che modo l’intelligenza artificiale sul dispositivo può potenziare i flussi di lavoro del team e migliorare la gestione dei processi?

Un modello che può funzionare è il fatto che l’attenzione di Apple sulla privacy significa che nessun individuo è contrassegnato, ma che i dati dei processi aziendali possono essere condivisi all’interno di un gruppo in forma anonima. L’IA potrebbe, ad esempio, seguire il percorso degli alberi decisionali, analizzare il tempo intercorso tra la comunicazione e la risoluzione e lavorare per identificare i colli di bottiglia nei processi aziendali che altrimenti non sarebbero visibili. Ciò supporterebbe inevitabilmente elementi utili come appuntamenti condivisi automatizzati e calendari di obiettivi aziendali e automazioni generate dal sistema per accelerare determinate attività.

Le cose semplici

Cosa succederebbe se il vostro Mac e il vostro iPhone lavorassero insieme per monitorare le scadenze di consegna del progetto e gli SLA? I rilevatori di dati che già utilizzate nelle e-mail, nei messaggi e altrove sulle piattaforme Apple mostrano che la tecnologia è già in grado di raccogliere tali informazioni, ma in che misura l’aumento dell’automazione di tali attività può dare impulso alla vostra azienda?

Inoltre, perché l’intelligenza artificiale sul dispositivo non potrebbe essere in grado di monitorare le proprie condizioni, avvisandovi quando il vostro Mac, iPhone, iPad o apparecchiature collegate di terze parti stanno per andare incontro a dei problemi e facendovi sapere il perché? Il monitoraggio a livello di sistema dei dispositivi di terze parti connessi posiziona potenzialmente i sistemi di machine learning di Apple in esecuzione su Apple Silicon al centro dell’infrastruttura dell’Industria 4.0.

Ho questa immagine in testa. Gli iPad in fabbrica monitoreranno i macchinari di produzione per identificare la probabilità del servizio, reindirizzando automaticamente la capacità e il flusso di produzione per mitigare preventivamente potenziali guasti alle apparecchiature. In teoria, la prima volta che un responsabile di fabbrica potrebbe sapere che la sua macchina sta per guastarsi potrebbe essere quando arriva un tecnico dell’assistenza per riparare un guasto che non è ancora emerso.

L’integrazione della piattaforma

Rimanendo con l’esempio della produzione intelligente, ecco una sequenza che mostra come l’intelligenza artificiale sul dispositivo potrebbe supportare i macchinari intelligenti.

L’iPad nella sezione 7 dello stabilimento di produzione ha segnalato un probabile guasto in una macchina rivettatrice essenziale
Lavorando con sistemi di gestione automatizzati e supervisori umani, ha deviato il lavoro programmato per quella macchina per le prossime 48 ore e ha convocato un tecnico dell’assistenza con una notifica al suo Apple Watch
All’arrivo in sezione, il tecnico indossa i suoi occhiali AR, che lo guidano fino alla macchina fornendo dati analitici e rendendo disponibili i manuali di assistenza sul campo
I componenti possono essere richiesti automaticamente e dati precisi sui risultati di consegna e riparazione possono essere resi disponibili in tempo reale durante la riparazione
Queste informazioni vengono automaticamente inserite nei sistemi dell’azienda, consentendo ad altre sezioni dell’azienda (e ai suoi clienti/partner) di fornire indicazioni precise per la consegna
La trasparenza e la risoluzione rapida portano a un collegamento con il cliente molto più efficace
Tali strumenti sono già in uso in tutta la produzione, ma il passaggio di Apple all’intelligenza artificiale sul campo attraverso le sue piattaforme significa che iPhone, iPad e Mac condivideranno intrinsecamente l’elaborazione del sistema operativo di cui hanno bisogno per prendere il loro posto al centro di questo futuro potenziato dall’IA.

Redazione DigitalWorld Italia

Comprensione della gestione e delle operazioni del modello

Monitoraggio dei modelli di machine learning per il model drift