Nella cornice dell’AI Seoul Summit 2024 in Corea del Sud, 16 leader mondiali dell’IA (tra cui Google, Amazon, Anthropic, Microsoft, IBM e OpenAI, Meta e Mistral AI) si sono impegnati in modo non vincolante a disattivare i propri modelli IA nel caso questi mostrassero segni preoccupanti per dare vita a uno scenario distopico. L’evento coreano segue di un anno l’AI Safety Summit 2023 in cui 28 nazioni e l’UE hanno sottoscritto la Dichiarazione di Bletchley, una visione condivisa per affrontare i rischi legati all’IA, seppur (anche in quella occasione) senza impegni concreti o pratici.

Il vertice di Seul ha prodotto una serie di impegni per la sicurezza dell’IA, tra cui dei framework su come misurare i rischi dei modelli di IA come la definizione del punto in cui i rischi diventano intollerabili e le azioni che i firmatari intraprenderanno a quel punto. Nel caso in cui queste misure di mitigazione non dovessero riuscire a mantenere i rischi al di sotto di una certa soglia, i firmatari si sono impegnati a non sviluppare o distribuire un modello o un sistema.

limitare ia

I firmatari del documento di Seoul si sono inoltre impegnati a:

  • Fare red-teaming dei loro modelli e sistemi di AI di frontiera, ovvero piattaforme di machine learning nascenti e su larga scala che portano l’intelligenza artificiale a nuovi livelli di sofisticazione e hanno anche capacità che potrebbero essere pericolose
  • Condividere le informazioni, investire nella sicurezza informatica e nelle salvaguardie contro le minacce interne
  • Incentivare la scoperta e la segnalazione di vulnerabilità da parte di terzi
  • Etichettare i contenuti dell’IA, dare priorità alla ricerca sui rischi sociali posti dall’IA e utilizzare l’intelligenza artificiale a fin di bene

Al vertice hanno partecipato anche numerose delegazioni governative (G7 più Singapore, l’Australia, le Nazioni Unite, il PECD e l’UE) e, sebbene si tratti di propositi assolutamente condivisibili, molti dettagli non sono stati ancora definiti e non lo saranno fino all’AI Action Summit che si terrà a inizio 2025.