Al giorno d’oggi, ogni ambito può essere impostato in maniera organizzata. Si raccolgono moltissimi dati che grazie a strumenti automatici migliorano l’organizzazione. Basti pensare alla ricerca del percorso tra due località, o ai dati biometrici in uso quotidiano (dal riconoscimento del volto come password al cardiofrequenzimetro con training suggerito), o anche a quanto siamo dipendenti da informazioni non controllate provenienti dai social network.

Il fattore discriminante tra le iniziative di successo e quelle destinate ad una breve e dolorosa agonia è oggi l’intelligenza artificiale (AI). L’unione dell’esperienza umana e della capacità di analisi automatica di enormi quantità di dati e dei processi che da loro prendono spunto sta diventando la regola di base della trasformazione digitale. Dati e processi vengono manipolati da tool all’interno d’una rinnovata toolchain alla quale si fa riferimento come MLOps (meno spesso AIOps), impostata sull’approccio DevOps.

AI come riorganizzatore di processi

Sapere è potere, sempre che qualcuno estragga informazione e valore. Per motivi storici, si fa riferimento a questo approccio partendo da come il settore industriale tedesco lo chiamò: Industria 4.0. Il 4.0 era una nomenclatura usata nel software che venne applicata alla quarta fase dell’industria nazionale secondo l’Istituto Fraunhofer, ma da allora quel numeretto, e poi l’intero concetto, sono stati applicati ovunque.

Avere dati puliti da un archivio storico continuamente aggiornato con altri dati anche IoT, farli analizzare in automatico per desumere comportamenti da ottimizzare per rendere chiara e modificabile l’intera catena di trasformazione dei dati (e quindi di generazione del valore) è la base per qualsiasi azienda.

Se nelle fabbriche c’è un aspetto più meccanico, di determinazione della cinematica inversa per far muovere i robot in armonia tra loro e con gli umani, resta comunque per tutti gli ambiti la possibilità di sviluppare modelli precisi che valutino molti dei rischi d’impresa oggi sistemati tra i “disastri” e li riconfigurino per entrare nei rischi ordinari. Un chiaro esempio è la manutenzione di ponti e viadotti, un argomento molto caro in Italia, che potrebbe diventare una questione di manutenzione preventiva – come per gli aerei – ed essere continuamente migliorata.

MLOps: in Cina si fa in un altro modo

Un punto oggi ancora non rilevante sui mercati al di qua e di là dell’Atlantico riguarda le differenze tra gli approcci. Non si può evitare una prima critica all’Europa. Il Vecchio Continente è pieno di comitati e classifiche e si bea della teoria che sa esprimere, senza far nulla per portarla alle aziende. I nazionalismi e le differenti lingue rendono inoltre impossibile acquisire grandi moli di dati omogenei che invece i numeri dell’inglese e del mandarino rendono più facili da raccogliere.

Cina e Stati Uniti hanno quindi un chiaro vantaggio nel mondo dell’AI. In Cina si seguono modalità e percorsi diversi da quelli USA, non solo per la barriera linguistica o per l’approccio verticale delle loro soluzioni (un’app è l’interfaccia al ciclo completo dei servizi, non solo a un layer).

Negli Stati Uniti e in Europa, i servizi di cloud sono Google, Amazon o Microsoft. Si pensi all’attuale caos relativo alla reale implementazione di Gaia-X, il teorico cloud europeo che dovrebbe trovare un linguaggio e un’architettura comune a decine di cloud diversi. In Cina, le aziende si affidano a Tencent o Alibaba.

In Occidente, la Cloud Native Computing Foundation (CNCF) si occupa della tecnologia dei container, compreso Kubernetes (e la KubeCon). In Cina seguono più la Fondazione TARS, sotto l’egida della Linux Foundation, orientata a microservizi open source.

Anche l’approccio all’informazione è diverso nelle due aree. Nel mondo a guida inglese sviluppatori anche singoli riescono a far parlare di sé in una o più delle infinite classifiche che compiliamo su qualsiasi cosa. Si tratta di vanity posts, ma non li neghiamo a nessuno. In Cina si parla poco e si prendono commesse locali ma di grandi dimensioni. Basta vedere i siti web di piccole o grandi aziende che siano non solo cinesi, ma anche giapponesi o sudcoreane: la comunicazione non è il loro forte.

Quindi in Occidente abbiamo classifiche e le sovradimensioniamo per comprendere moltissime idee buone solo sulla carta, mentre in Oriente non fanno classifiche e non saprebbero come farle. Le classifiche “internazionali” fatte da anglofoni spesso comprendono alcuni nomi di aziende cinesi, ma sono una goccia nel mare di soluzioni che si stanno sviluppando.

In attesa di un sistema che renda inglese e mandarino tra loro interscambiabili, potremo valutare il livello dei rispettivi blocchi solo dai risultati sul mercato.

Dati puliti ed aggiornati

Tornando all’impiego dell’AI in azienda, la prima necessità resta l’accesso ad una enorme quantità di dati puliti. La pulizia del dato è un concetto finora avulso dal contesto dell’analisi a base umana. Con l’analisi automatica, qualsiasi difformità dalle specifiche di un piccolo set di dati inquina l’intero set di dati e porta l’analisi a conclusioni sbagliate.

La seconda necessità richiede la riorganizzazione dei processi. Le analisi parziali ottenute con strumenti di intelligenza artificiale e machine learning (ML) indicano chiaramente come riorganizzare il flusso di elaborazione in modo da allineare dati e risultati.

La terza ed ultima necessità richiede di aggiornare periodicamente la finestra temporale per la validità dei dati. Lo storico ha un enorme valore commerciale (si pensi ai dati di guida che possono avere Tesla o anche Octo Telamatics), ma poiché nel tempo cambiano sia i comportamenti (sintetizzati nei dati), sia il concetto di pulizia del dato (si pensi ai bias comportamentali), i dati più vecchi vanno periodicamente eliminati dal set impiegato per le analisi.

ML in pratica: cinque fasi, anzi sette

Un interessante articolo di Chip Huyen, aggiornato a fine 2020, cita (e spesso analizza) quasi 300 tool di ML. Nessuna proposta italiana ne fa parte.

Bisogna considerare che la maggior parte degli strumenti è ancora sconosciuta o nascosta nelle università. Nelle scelte bisogna stare molto attenti. Un effetto freno nei lanci è certamente dovuto alla particolare condizione economica del 2020-2021, ma subito dopo la curva dei rilasci di nuovi tool sarà ancora più rapida di prima.

A titolo personale, Huyen suggerisce tool per le principali fasi di sviluppo, comprendendo anche la compliance al GDPR (PySyft) e la riduzione di dimensioni necessaria per l’Edge computing (Coral SOM).

Le altre cinque fasi che considera sono monitoring (Dessa), data labeling (Snorkel), CI/CD test (Argo), deployment (OctoML) e Inference Optimization (TensorRT).

API e piattaforme

I big dell’IT, quali Google, Microsoft, IBM e Amazon, offrono API di apprendimento automatico tramite le rispettive piattaforme cloud, permettendo agli sviluppatori di creare servizi in modo più semplice, alleggerendo in parte la complessità degli algoritmi. C’è anche un numero crescente di framework di apprendimento profondo (deep learning) open source rivolti a sviluppatori e data scientist.

Una selezione dei migliori strumenti di machine learning oggi disponibili dai grandi fornitori è certamente utile.

Negli ultimi tempi, alcuni sono stati acquisiti e non sono più disponibili al grande pubblico.

Anche l’importanza relativa è cambiata negli anni. CWI aveva già affrontato questo argomento nel passato. Ecco la lista aggiornata.

MLOps europee

Curiosando tra le proposte europee abbiamo identificato alcuni nomi interessanti. Conoscerli e seguirli può rivelarsi importante in un immediato futuro. Ve li proponiamo suddivisi per nazione: tra parentesi il campo di applicazione.

Hardware intelligence europea

Ecco una seconda, e forse più ampia, critica alla mentalità europea. L’Unione europea ha compreso che drammatico errore sia stato lasciare la produzione dei chip in generale, e dei microprocessori in particolare, nelle mani degli altri. Il caso più eclatante è senz’altro Arm, ma non è l’unico.

Se le Silicon Foundry sono complesse da riportare nel Vecchio Continente, anche dare un’occhiata a quello che c’è in casa non è certo un errore.

Nell’intelligenza artificiale si possono citare almeno tre proposte hardware europee, di diverso ambiente e sostanza: Graphcore, Greenwaves e Prophesee. Vedere esattamente cosa c’è tra i finanziatori di ciascuna di queste aziende esula dagli scopi di questo articolo, ma un’occhiata contestualizza bene la situazione reale.

Graphcore, formalmente irlandese, produce acceleratori AI. Due le aziende francesi. Greenwaves propone un processore a batteria, quindi ultra low power, per l’AI nell’internet delle cose e l’Edge; Prophesee dichiara di aver sviluppato il sistema di visione a eventi più avanzato oggi disponibile.