Google e Stable Diffusion trasformano immagini in video con la IA

google ia
VLOGGER di Google e SV3D di Stability AI sono due nuovi strumenti di IA generativa per trasformare una foto in un video.

Si chiama VLOGGER ed è un nuovo strumento di IA generativa di Google per animare una foto utilizzando nient’altro che la registrazione del discorso di una persona. VLOGGER non avrebbe infatti bisogno di alcun addestramento, di rilevamento dei volti o di altre regolazioni; basta fornirgli una foto e una registrazione audio della lunghezza desiderata e lo strumento si mette al lavoro.

“Il nostro obiettivo è colmare il divario tra i recenti sforzi di sintesi video, che possono generare video dinamici senza alcun controllo sull’identità o sulla posa, e i metodi di generazione di immagini controllabili”, affermano i ricercatori di Google. “Settori come la creazione di contenuti, l’intrattenimento o i giochi hanno tutti una forte richiesta di sintesi umana, ma la creazione di video realistici di esseri umani è ancora complessa e piena di artefatti”.

Alcuni video pubblicati sulla pagina GitHub del progetto e su X (qui sotto un esempio), per quanto impressionanti, non sono in grado di ingannare nessuno e c’è ancora qualcosa di incredibilmente irrealistico in essi. Nonostante ciò i ricercatori hanno dichiarato che VLOGGER è a un livello già molto più avanzato rispetto ai precedenti esperimenti di questo genere e potrebbe essere utilizzato “non solo per facilitare i processi creativi, ma anche per abilitare casi d’uso completamente nuovi, come il miglioramento della comunicazione online, l’istruzione o gli assistenti virtuali personalizzati”.

VLOGGER si basa su un processo in due fasi per generare video partendo da immagini. Nella prima fase un modello generativo stocastico predice il movimento del corpo e le espressioni facciali dall’audio in ingresso, che secondo i ricercatori “è necessario per modellare la mappatura sfumata tra il parlato e la posa, lo sguardo e l’espressione”. Nella seconda fase, viene invece utilizzato un modello per fornire un controllo nei domini temporale e spaziale.

Il progetto ha richiesto anche la creazione di un nuovo set di dati curati che il team ha chiamato MENTOR e che comprende circa 800.000 identità. Fatto sta che su X diversi utenti hanno criticato la resa finale di questi video, definiti a più riprese rigidi e palesemente generati dall’intelligenza artificiale.

Viene quindi spontaneo chiedersi come mai Google se ne esca nel 2024 con un tool del genere e con risultati così “modesti” e se è vero che l’assenza di un qualsiasi training del modello non è una cosa da poco, è altrettanto vero che siamo ancora indietro per un utilizzo commerciale di questo tool, tanto che non è chiaro se Google abbia intenzione di rilasciare VLOGGER o se questo sia solo un progetto di ricerca. La cosa certa è che il lavoro da fare sembra essere ancora tanto.

Google non è però l’unica impegnata in questo ambito. Anche Stability AI infatti, con il nuovo Stable Video 3D (SV3D), ha annunciato per gli abbonati al piano a pagamento Professional Membership un modello di intelligenza artificiale generativa di tipo image-to-video, che permette di creare filmati in tre dimensioni partendo da una singola immagine fornita come input.

Al momento SV3D può generare video composti da 21 fotogrammi con una risoluzione pari a 576×576 pixel e, come dimostrato da un test effettuato da VentureBeat, il risultato ottenuto non è affatto male, seppur si tratti di un video di una manciata di secondi con animazioni ridotte al minimo. Secondo Stability AI questo nuovo tool di IA generativa è rivolto soprattutto ai creator in ambito gaming ed e-commerce interessati alla generazione di asset 3D mediante l’intelligenza artificiale.

Aziende:
Google
Condividi:
 

Dell e NVIDIA insieme per nuovi prodotti e nuove soluzioni di IA generativa

Nutanix NVIDIA IA generativa
Dell AI Factory with NVIDIA è la prima soluzione di IA end-to-end del settore per le aziende che abbraccia workstation, data center e cloud per potenziare l'era dell'IA generativa.

Dell Technologies sta rafforzando la sua collaborazione con NVIDIA per aiutare le imprese ad adottare l’IA. Grazie all’espansione del portafoglio di soluzioni Dell Generative AI, compresa la nuova Dell AI Factory with NVIDIA, le organizzazioni possono accelerare l’integrazione dei propri dati, degli strumenti IA e dell’infrastruttura on-premises per massimizzare gli investimenti in IA generativa.

Dell AI Factory with NVIDIA è una soluzione aziendale end-to-end che integra le capacità di computing, storage, dispositivi client, software e servizi di Dell con l’infrastruttura IA avanzata e la suite software di NVIDIA, il tutto supportato da un fabric di networking ad alta velocità.

Fornita come soluzione completamente integrata, Dell AI Factory with NVIDIA si avvale di una progettazione a livello di rack, con test e convalide rigorosi per offrire una soluzione senza soluzione di continuità per la trasformazione dei dati in insight e risultati di valore. Questa soluzione sfrutta anche le offerte esistenti in materia di sicurezza dei dati aziendali con le offerte di servizi Dell in materia di sicurezza e privacy.

Disponibile tramite i canali tradizionali e Dell APEX, Dell AI Factory with NVIDIA supporta un’ampia gamma di casi d’uso e applicazioni di IA per supportare l’intero ciclo di vita della GenAI, dalla creazione e messa a punto dei modelli, all’incremento e all’inferenza. I clienti possono inoltre usufruire di servizi professionali di livello enterprise che aiutano le organizzazioni ad accelerare la strategia, la preparazione dei dati, l’implementazione e l’adozione dell’AI Factory.

dell nvidia

Queste le altre novità previste nell’ambito della collaborazione tra Dell e NVIDIA:

  • Dell Technologies collaborerà con NVIDIA per introdurre un’architettura su scala rack, ad alta densità e raffreddata a liquido, basata sul superchip NVIDIA Grace Blackwell. Questi sistemi supporteranno l’ecosistema di nuova generazione con l’obiettivo di fornire le basi per il miglioramento della densità delle prestazioni per i carichi di lavoro IA aziendali.
    Disponibili entro fine anno, i server Dell PowerEdge XE9680 supporteranno i nuovi modelli di GPU NVIDIA, fra cui la GPU NVIDIA B200 Tensor Core, che dovrebbe offrire prestazioni di inferenza IA fino a 15 volte superiori e un costo totale di proprietà inferiore. I server Dell PowerEdge supporteranno anche altre GPU basate su architettura NVIDIA Blackwell, nonché le GPU H200 Tensor Core e le piattaforme di networking NVIDIA Quantum-2 InfiniBand e Spectrum-X Ethernet.
  • Dell Generative AI Solutions with NVIDIA – Retrieval-Augmented Generation (RAG) sfrutta i nuovi microservizi di NVIDIA AI Enterprise per offrire una soluzione full-stack pre-validata per accelerare l’adozione dell’IA nelle aziende con RAG. Questa soluzione aiuta le organizzazioni a migliorare la qualità dei modelli GenAI e ad aumentare l’accuratezza dei risultati con dati aziendali e basi di conoscenza proprietarie.
  • Dell Generative AI Solutions with NVIDIA – Model Training offre una soluzione full-stack pre-convalidata per le organizzazioni che desiderano costruire i propri modelli personalizzati e specifici per il dominio.

Immagine2

“Le organizzazioni si stanno affrettando a sperimentare l’IA, ma le sfide per raggiungere il ROI sono molte. I problemi di sovranità dei dati, le preoccupazioni legali e di conformità e la qualità dei dati sono tutti elementi di primaria importanza. Le nuove offerte, come le soluzioni Generative AI di Dell con NVIDIA – RAG, offrono alle aziende un percorso più semplice verso l’IA, aiutandole ad aumentare la fiducia e a sviluppare le proprie capacità di IAI affidabili in grado di fornire un impatto aziendale sostanziale“, ha dichiarato Dave Vellante, Chief Analyst di theCUBE Research. “La nostra ricerca dimostra che le aziende si stanno rivolgendo a leader del settore come Dell e NVIDIA per contribuire a fornire competenze e servizi di IA al fine di ridurre i rischi e raggiungere prima il ROI”.

Condividi: