AWS punta in alto con i servizi di IA generativa personalizzata per le aziende
AWS vuole diventare il punto di riferimento per le aziende che desiderano ospitare e perfezionare i loro modelli di IA generativa personalizzati. Per farlo, ha annunciato il lancio in versione preview di Custom Model Import, una nuova funzionalità di Bedrock (la suite di servizi di IA generativa di AWS focalizzata sulle aziende) che consente alle organizzazioni di importare e accedere ai loro modelli di IA generativa interni come API completamente gestite.
I modelli proprietari delle aziende, una volta importati, beneficeranno della stessa infrastruttura degli altri modelli di IA generativa nella libreria di Bedrock come Llama 3 di Meta o Claude 3 di Anthropic e avranno strumenti per espandere le loro conoscenze, effettuare il fine-tuning e implementare salvaguardie per mitigare i pregiudizi.
Vasi Philomin, VP GenAI di AWS, sostiene che Bedrock offre una gamma più ampia e profonda di opzioni di personalizzazione dei modelli rispetto alla concorrenza. Le opzioni di personalizzazione includono Guardrails, che consente agli utenti di Bedrock di configurare soglie per filtrare (o almeno tentare di filtrare) gli output dei modelli per cose come discorso d’odio, violenza e informazioni personali o aziendali private, e Model Evaluation, uno strumento che i clienti possono utilizzare per testare le prestazioni di un modello (o più modelli) su un determinato set di criteri.
Custom Model Import supporta attualmente solo tre architetture di modelli: Flan-T5 di Hugging Face, Llama di Meta e i modelli di Mistral.
Ciò che è unico per Bedrock è la famiglia di modelli Titan per l’IA generativa, che proprio in questi giorni ha ricevuto importanti aggiornamenti. Titan Image Generator, il modello text-to-image di AWS, è disponibile per tutti dopo essere stato lanciato in anteprima a novembre, rispetto alla quale può generare immagini con maggior “creatività”. AWS utilizza una combinazione di fonti di dati first party e dati concessi in licenza per addestrare Titan Image Generator e paga le commissioni di licenza ai proprietari di contenuti.
Per affrontare la minaccia dei deepfake, AWS afferma che le immagini create con Titan Image Generator avranno una filigrana invisibile resistente alle manomissioni. L’altra novità riguarda la seconda generazione (V2) del modello Titan Text Embeddings, che converte il testo in rappresentazioni numeriche, chiamate embedding, per alimentare applicazioni di ricerca. AWS afferma che V2 riduce di quattro volte lo spazio di archiviazione necessario pur mantenendo il 97% dell’accuratezza, superando altri modelli comparabili.