Amazon Bedrock offre modelli di base per costruire applicazioni di IA generativa
Amazon Web Services (AWS) ha rilasciato un nuovo servizio, denominato Amazon Bedrock, che fornisce diversi modelli di base progettati per consentire alle aziende di personalizzare e creare le proprie applicazioni di IA generativa, compresi i programmi per uso commerciale. Amazon Bedrock mette a disposizione degli utenti modelli di base di AI21 Labs, Anthropic, Stability AI e Amazon accessibili tramite un’API. Il servizio, annunciato giovedì e ora disponibile in anteprima privata, arriva solo un giorno dopo che Databricks ha annunciato il suo modello linguistico di grandi dimensioni (LLM) open-source, Dolly 2.0, e ha una strategia simile: aiutare le aziende ad aggirare i vincoli dei modelli a ciclo chiuso (come ChatGPT) che impediscono loro di creare le proprie applicazioni di IA generativa personalizzate.
I modelli di base addestrati e a circuito chiuso impediscono alle aziende di creare qualsiasi forma di IA generativa che possa competere con quella originale. Questo vincolo ha visto un’accelerazione della ricerca per la creazione di modelli open-source e altri metodi alternativi per l’IA generativa che possono essere destinati all’uso commerciale, poiché le aziende richiedono modelli personalizzabili per casi d’uso mirati.
I modelli base di Amazon per l’IA
I modelli di base di Amazon disponibili tramite il nuovo servizio includono i Titan FM di Amazon, che consistono in due nuovi LLM presentati in anteprima giovedì e che dovrebbero essere resi disponibili nei prossimi mesi. Il primo modello Titan Foundation, secondo l’azienda, è un LLM generativo per compiti quali riassunto, generazione di testi, classificazione, domande e risposte aperte ed estrazione di informazioni. Il secondo modello è un LLM che traduce gli input di testo (parole, frasi o eventualmente grandi unità di testo) in rappresentazioni numeriche (note come embeddings) che contengono il significato semantico del testo.
“Sebbene questo LLM non generi testo, è utile per applicazioni come la personalizzazione e la ricerca perché, confrontando gli embeddings, il modello produrrà risposte più pertinenti e contestuali rispetto alla corrispondenza delle parole” ha scritto Swami Sivasubramanian, vicepresidente del settore dati e machine learning di AWS. Secondo l’azienda, questi modelli di base sono stati messi a punto sia per rilevare e rimuovere i contenuti dannosi nei dati aziendali forniti per la personalizzazione, sia per rimuovere i contenuti dannosi dagli output.
Amazon Bedrock, secondo Sivasubramanian, può essere utilizzato per trovare il modello giusto per vari casi d’uso e personalizzarlo di conseguenza con i set di dati aziendali prima di integrarlo e distribuirlo nelle loro applicazioni utilizzando gli strumenti AWS. “I clienti devono semplicemente indicare a Bedrock alcuni esempi etichettati in Amazon S3 e il servizio è in grado di mettere a punto il modello per un particolare compito senza dover annotare grandi volumi di dati (sono sufficienti anche solo 20 esempi)”, ha detto Sivasubramanian.
Addestrare i modelli IA senza utilizzare i dati aziendali
“Nessuno dei dati del cliente viene utilizzato per addestrare i modelli sottostanti e, poiché tutti i dati sono crittografati e non escono dal Virtual Private Cloud (VPC) del cliente, i clienti possono essere certi che i loro dati rimarranno privati e riservati”, ha aggiunto Sivasubramanian. Oltre ai modelli Titan, Bedrock include la famiglia di LLM multilingue Jurassic-2 di AI21 Labs, che utilizzano istruzioni in linguaggio naturale per generare testi in spagnolo, francese, tedesco, portoghese, italiano e olandese.
L’LLM Claude di Anthropic, anch’esso incluso in Bedrock, è in grado di eseguire un’ampia gamma di compiti di conversazione e di elaborazione del testo e si basa sulla ricerca di Anthropic sulla formazione di sistemi di intelligenza artificiale onesti e responsabili. Inoltre, Bedrock fornisce un modello di base per il text-to-imaging sotto forma della suite text-to-image di Stability AI.
Altri aggiornamenti all’arsenale di strumenti di IA generativa di AWS includono la disponibilità generale di Amazon CodeWhisperer per Python, Java, JavaScript, TypeScript e C#. CodeWhisperer, un generatore di codice basato sull’intelligenza artificiale, è in concorrenza con CoPilot di GitHub, che ha recentemente aggiunto funzioni di intelligenza artificiale per aiutare gli sviluppatori. AWS ha infine annunciato la disponibilità generale delle istanze cloud Inf2 alimentate da AWS Inferentia2. Secondo l’azienda, queste istanze sono “ottimizzate specificamente per applicazioni di IA generativa su larga scala con modelli contenenti centinaia di miliardi di parametri”.