IBM ha annunciato che la piattaforma di servizi di intelligenza artificiale per il business watsonx.ai ospiterà anche il modello linguistico Llama 2 di Meta nella sua versione da 70 miliardi di parametri.

L’annuncio è conseguenza di una collaborazione tra IBM e Meta che si estende anche ad altri progetti open source, come PyTorch e Presto, utilizzato per il servizio watson.data, ed è integrato nella strategia che prevede di integrare in wastonx non solo algoritmi proprietari di IBM, ma anche di terze parti. Attualmente, attraverso watsonx sono accessibili anche modelli di Hugging Face per l’elaborazione del linguaggio naturale, ottimizzati per rispondere a domande, classificazione ed estrazione del testo, generazione e riassunto di contenuti.

Llama 2 è un modello linguistico di IA generativa simile a GPT, che alimenta il celebre Chat GPT e che Meta ha rilasciato in modalità open source “con restrizioni”. Le aziende che vogliano utilizzare Llama 2 e che hanno più di 700 milioni di utenti devono richiedere un’autorizzazione che Meta può rilasciare a sua totale discrezione. Una mossa che sembra stata cucita su misura per impedire che alcune specifiche aziende cloud, in particolare cinesi, possano proporre un proprio servizio di IA generativa.

Essendo open source, il modello potrebbe quindi essere usato direttamente dalle aziende su propri server. Llama 2 con 70 miliardi di parametri può funzionare su hardware con 64 GB di Ram e GPU con 48 GB di VRAM: una configurazione “carrozzata” ma che rimane nel campo delle migliaia di euro. Servono però competenze adeguate a gestire una tecnologia ancora nuova e che può avere risvolti ancora imprevedibili per quanto riguarda gli aspetti di governance.

È qui che si inserisce la proposta di IBM di un servizio “chiavi in mano” e nel quale l’azienda ha inserito funzioni di salvaguardia (AI guardrails) per filtrare contenuti che possano essere dannosi od offensivi, sfruttando le possibilità di fine tuning messe a punto da Meta sui suoi modelli. Oltre ovviamente a poter fornire alle azienda competenze tecniche e strategiche per allineare i modelli ai propri obiettivi di business “grazie ai suoi 21.000 consulenti specializzati in gestione dei dati, AI e automazione e 1.000 esperti di IA generativa”, dichiara l’azienda.

Le funzionalità Llama 2 in watsonx sono state rese al momento disponibili in modalità sperimentale ad alcuni clienti selezionati.

(Immagine di apertura:  Robert Way / Shutterstock.com)