Legal analytics: Accenture applica NLP per analizzare migliaia di contratti
L’intelligenza artificiale può essere un alleato per cercare informazioni utili in contratti e documenti, di cui generalmente le aziende abbondano. Una strategia che si sta rivelando particolarmente utile è l’elaborazione del linguaggio naturale (NPL, Natural Language Processing), una branca dell’AI focalizzata sulla comunicazione, su cui Accenture ha sviluppato una soluzione per esaminare i contratti legali.
Con oltre un milione di contratti nel suo sistema di registrazione e migliaia che se ne aggiungono ogni mese, per il dipartimento legale di Accenture cercare informazioni specifiche in ciascun contratto era una sfida impegnativa, che richiedeva un notevole dispendio di tempo per una ricerca dettagliata e il confronto incrociato di documenti.
“Per anni, abbiamo gestito manualmente i contratti di assicurazione per esaminare clausole e obblighi contrattuali in caso di eventi specifici che accadono in qualche parte del mondo, come per esempio un alluvione a Chennai, o di determinati eventi che sono al di fuori del nostro controllo”, spiega Mike Maresca, general manager del settore digital business transformation, operations, and enterprise analytics di Accenture.
Il team Internal IT Enterprise Insight dell’azienda ha deciso di sfruttare l’elaborazione del linguaggio naturale e l’intelligenza artificiale per migliorare la ricerca dei contratti nel proprio sistema di registrazione e individuare velocemente le risposte di cui aveva bisogno il team legale.
L’azienda ha quindi lanciato il progetto Accenture’s Legal Intelligent Contract Exploration (ALICE), sviluppato per rispondere a due esigenze fondamentali. In primo luogo, aiutare il dipartimento legale a eseguire ricerche di testo generali su oltre un milione di contratti nel sistema Manage myRecords (MMR) dell’azienda. In secondo luogo, era necessario abilitare la ricerca di clausole contrattuali.
“Il nostro staff di data scientist ha iniziato a modellare soluzioni di analisi in grado di indicizzare quel vasto archivio di contratti e costruire algoritmi analitici specifici per estrarre termini e condizioni”, afferma Maresca.
Non è stato un compito facile, poiché i contratti storici di Accenture non erano stati stilati mettendo delle “etichette” o delle parole chiave nelle clausole. Questo significa che il team non è stato in grado di costruire e valutare un modello di classificazione per il progetto e ha dovuto determinare come sviluppare il componente di identificazione delle clausole senza dati etichettati.
Alla sfida si aggiunge il fatto che molti dei contratti di Accenture sono personalizzati in base al cliente, che spesso stabilisce i propri termini e condizioni in diversi formati. Ciò significa che il team non poteva applicare un modello standard per identificare le clausole attraverso parole chiave quali “forza maggiore”, “responsabilità”, “riservatezza dei dati” e così via. I contratti non fanno necessariamente riferimento direttamente alle clausole, quindi la soluzione ha richiesto la ricerca di parole chiave correlate che potessero identificare la presenza di una clausola.
Il potere dell’elaborazione del linguaggio naturale
Per risolvere questo problema, il team ha utilizzato il “word embedding“, un metodo NLP che facilita il confronto tra parole basate sulla somiglianza semantica. Il modello estrae un elenco di parole chiave e i relativi punteggi di pertinenza dai contratti, “consentendo alla soluzione di attribuire un punteggio che indica la rilevanza di ciascun paragrafo di un documento per un particolare tipo di clausola”, sottolinea Maresca.
Il modello di word-embedding di Accenture analizza i documenti contrattuali paragrafo per paragrafo, cercando parole chiave per determinare se il paragrafo si riferisce a una particolare clausola. Per esempio, parole come “alluvione”, “terremoto” o “disastro” si abbinano comunemente con la clausola “per cause di forza maggiore”.
“L’analisi ci consente di cercare termini, condizioni e clausole legali”, prosegue Maresca. “Siamo partiti con la lingua Inglese e abbiamo stratificato le capacità di traduzione”.
Il team di Maresca è passato dall’idea concettuale al progetto pilota attraverso una serie di sprint che hanno richiesto sei mesi. Il team ha testato il progetto pilota con vari gruppi di utenti legali Accenture e ha utilizzato i risultati per costruire un progetto minimo realizzabile, che è stato poi utilizzato per arrivare alla distribuzione completa su scala aziendale, avvenuta otto mesi dopo.
Il lancio dei legal analytics
Maresca cita la forte collaborazione tra l’Internal IT Enterprise Insight Studio, il dipartimento legale e un team di sviluppo IT come elemento essenziale per portare il progetto dal prototipo alla distribuzione finale. Gli esperti di dati nel team MMR sono stati fondamentali per comprendere la struttura dei metadati e come collegare tali metadati al testo dei contratti. Gli esperti legali hanno contribuito a costruire il componente iniziale di estrazione della clausola. Il team di sviluppo comprendeva data scientist, ingegneri UI/UX, ingegneri software e architetti funzionali.
Oggi il sistema ALICE è pienamente implementato e ha migliorato la capacità di Accenture di identificare e comprendere i rischi. Maresca afferma si è notevolmente ridotto il tempo che gli avvocati devono dedicare alla lettura dei contratti per cercare informazioni specifiche.
“Il modello è stato quindi applicato ad altri scenari ‘what if?’ in cui è possibile trovare opportunità di valore”, conclude Maresca. “I casi d’uso si sono moltiplicati: stiamo trovando nuovi modi per raccogliere valore dai dati che abbiamo”.
Il progetto ALICE è parte di una ampia trasformazione digitale che Accenture sta conducendo nell’ambito delle sue capacità di legal analytics, ovvero degli analytics applicati alle questioni legali. In questa visione, ALICE sarà un hub di riferimento per vari servizi che verranno via via implementati.