I generatori video IA crescono: Google Veo arriva su YouTube Shorts e Alibaba lancia un tool open source
C’è sempre più fermento per i generatori video IA e le ultime novità riguardano Google e Alibaba. Durante l’evento Made On YouTube, la grande G ha annunciato l’integrazione di Veo, il modello di generazione video AI di Google DeepMind, in YouTube Shorts. Questa novità, prevista entro fine anno, permetterà ai creatori di contenuti di generare sfondi di alta qualità e clip di sei secondi.
Veo, presentato alla conferenza Google I/O 2024, è un modello all’avanguardia che compete direttamente con Sora di OpenAI, Gen-3 Alpha di Runway e altri modelli simili. Può creare clip video in 1080p in vari stili cinematografici e rappresenta un significativo miglioramento rispetto alla funzione Dream Screen di YouTube, lanciata nel 2023 per generare sfondi video.
Grazie a questa novità, sarà possibile inserire un prompt testuale in Dream Screen, ottenere quattro immagini e animarne una con Veo. Le creazioni su Shorts saranno contrassegnate con un watermark utilizzando la tecnologia SynthID di DeepMind per identificarle come generate dall’IA.
Alibaba, sempre molto attivo su ogni versante dell’intelligenza artificiale, ha invece lanciato una tecnologia IA text-to-video open source (di cui sappiamo ancora poco) come parte della sua famiglia di generatori di immagini Tongyi Wanxiang, unendosi a un numero crescente di aziende tecnologiche cinesi che entrano in questo mercato emergente.
Da quanto dichiarato dal colosso cinese, il nuovo modello è in grado di generare video di alta qualità con un’ampia varietà di stili visivi, dalle scene realistiche all’animazione 3D, partendo da istruzioni testuali in cinese e inglese. Può anche trasformare immagini statiche in video dinamici ed è dotato di un’architettura avanzata con trasformatore di diffusione (DiT) per migliorare la qualità della ricostruzione video.