NTT DATA e Train, spin-off dell’IRCCS Istituto Clinico Humanitas specializzato in IA generativa, hanno presentato il report Generative AI and Synthetic Data for Clinical Application, che indaga sull’impatto dell’IA generativa nei settori farmaceutico e sanitario.

Il report evidenzia come la GenAI permetta di creare dati sintetici, ossia informazioni che, pur mantenendo le stesse proprietà statistiche dei dati reali, non contengono informazioni personali, risultando così particolarmente utili per la ricerca, i test e l’addestramento di modelli di machine learning.

Il valore dei dati sintetici nella sanità

I dati sintetici offrono molteplici vantaggi:

  • Possono essere generati in grandi quantità, garantendo un’ampia base di dati per analisi e formazione di modelli
  • Proteggono la privacy eliminando il rischio di divulgazione di dati sensibili
  • Possono essere progettati per mitigare bias presenti nei dati reali

Le applicazioni in ambito sanitario sono significative, visto che i dati sintetici supportano la medicina personalizzata, accelerano la scoperta di nuovi farmaci e ottimizzano i flussi di lavoro ospedalieri e di ricerca. Nei trial clinici, ad esempio, l’IA generativa consente di creare “pazienti sintetici”, ovvero simulazioni basate su dati reali che aiutano a prevedere gli effetti delle terapie e a migliorare la selezione dei pazienti per gli studi clinici.

L’innovazione di Train nelle malattie rare

Le malattie rare pongono sfide particolari, tra cui la difficoltà di reperire pazienti per studi clinici. Train, grazie alla sua esperienza proprio in IA generativa e dati sintetici, ha sviluppato una piattaforma avanzata che combina generazione di dati sintetici e digital twin per ottimizzare i trial clinici. La piattaforma permette di creare gruppi di controllo virtuali e selezionare in modo più mirato i pazienti per gli studi, rendendo il processo più sostenibile ed efficace.

Un elemento chiave di questa innovazione è il framework SAFE (Synthetic vAlidation FramEwork powered by Train), che garantisce l’affidabilità dei dati sintetici attraverso validazioni statistiche e cliniche. Inoltre, Train utilizza tecnologie avanzate come il federated learning per garantire sicurezza e protezione della privacy, mantenendo i dati decentralizzati e conformi alle normative vigenti.

Dati sintetici

Il ruolo di NTT DATA

In questo contesto, NTT DATA fornisce l’infrastruttura tecnologica necessaria affinché le soluzioni di IA generativa possano essere scalabili, compliant con le normative e facilmente integrabili nei flussi di lavoro esistenti.

Grazie alla sua esperienza nei servizi IT e nelle tecnologie sanitarie, NTT DATA assicura che i modelli generativi possano essere adottati in modo affidabile da ospedali, istituti di ricerca e aziende farmaceutiche. La collaborazione tra Train e NTT DATA punta quindi a rendere l’IA generativa una realtà concreta e sicura per la medicina del futuro.

Attenzione ai rischi

Ci sono però anche dei rischi da valutare nell’utilizzo di dati sintetici per l’addestramento di modelli IA in medicina. I modelli di IA generici, ad esempio, non sono adatti per l’uso clinico, dove precisione, affidabilità e sicurezza sono fondamentali. I dati sintetici, se non generati e validati con attenzione, possono quindi portare a risultati inaccurati o fuorvianti.

Un altro rischio significativo è che i dati sintetici non riflettano accuratamente la complessità e la variabilità dei dati reali dei pazienti. Questo può portare a modelli di IA che non generalizzano bene nel mondo reale, con potenziali conseguenze negative sulla diagnosi e sul trattamento dei pazienti. Infine, è necessario bilanciare privacy e accuratezza. Visto però che mantenere la privacy dei pazienti può richiedere una riduzione dell’accuratezza dei dati sintetici, bisogna gestire questo trade-off critico con la massima attenzione.

“I modelli di intelligenza artificiale specializzati di Train, uniti alla robustezza della piattaforma di NTT DATA, rappresentano una sinergia vincente per l’adozione dell’IA generativa in ambito medico e farmaceutico. Questa collaborazione garantisce sicurezza, trasparenza e affidabilità nella gestione dei dati sanitari e nell’integrazione di modelli avanzati di AI nei processi esistenti” ha dichiarato Emanuele Corbetta, Head of Life Sciences di NTT DATA Italia.

Saverio D’Amico, CEO e Co-Founder di Train, ha aggiunto: “Confidiamo che questa collaborazione possa plasmare il futuro della tecnologia sanitaria, migliorando le condizioni dei pazienti, accelerando la scoperta di nuovi farmaci e ottimizzando i processi clinici”.