DreamWorks Animation è per molti versi un produttore di dati digitali. I film che realizza comprendono infatti più terabyte di dati, creati da team di artisti che lavorano con sofisticati strumenti di animazione digitale in una complessa pipeline di dati. Quando la pandemia COVID-19 ha colpito gli USA, la produzione di DreamWorks è stata in grado di continuare grazie alla pianificazione della continuità aziendale, all’analisi dei dati e a un’architettura cloud multi-tenant.

“Potete guardare ai nostri film come dati, tramite uno streamer o un proiettore digitale in un cinema” afferma Skottie Miller, vice presidente dell’architettura della piattaforma e dei servizi di DreamWorks. “Con il nostro ambiente multi-tenant, quando è arrivata la pandemia cosa è cambiato davvero per noi? Operiamo ancora come un cloud multi-tenant e abbiamo ancora i nostri dati nella sede principale di Glendale”.

DreamWorks ha distribuito il suo ultimo film, Trolls World Tour, all’inizio di aprile solo in versione digitale su diverse piattaforme di contenuti video on-demand, poiché gran parte degli Stati Uniti stava per andare in lockdown. Il film ha richiesto 1.200 TB di spazio di archiviazione e i team creativi hanno gestito e utilizzato 500 milioni di file digitali mentre lavoravano al progetto. DreamWorks avvia la produzione di film con requisiti simili all’incirca ogni 4-6 mesi e il loro completamento richiede solitamente dai 2,5 ai 3 anni.

L’IT di DreamWorks esegue tutte le normali funzioni del caso, come il supporto delle risorse umane, la gestione dei sistemi e così via, ma la sua responsabilità più importante è supportare l’impianto di produzione digitale. Gli artisti di DreamWorks utilizzano infatti strumenti software sofisticati, molti dei quali sono stati creati dalla società stessa o, in alcuni casi, acquistati da fornitori e modificati pesantemente.

Gli artisti usano questi strumenti per creare dati. Tutti questi dati vengono inseriti in una pipeline di big data per aiutare DreamWorks a eseguire analisi predittive utilizzando AIOps, una tendenza emergente in cui, grazie alla tecnologia NetApp Active IQ, l’intelligenza artificiale e il machine learning vengono utilizzati per automatizzare il monitoraggio e la mitigazione dei problemi operativi.

“È un ambiente molto complesso e dinamico”, afferma Jeff Wike, CTO di DreamWorks. “Quando l’infrastruttura o gli strumenti non funzionano correttamente o non funzionano bene, ciò ha un impatto diretto sulla capacità della nostra attività di funzionare. C’è una correlazione diretta tra la tecnologia e la nostra capacità di fare film”.

DreamWorks non è estranea alla pianificazione della continuità aziendale. Con la sua sede a Glendale, in California, i terremoti e gli incendi sono infatti, se non all’ordine del giorno, eventi piuttosto frequenti (soprattutto gli incendi). “Abbiamo sempre guardato a come distribuiamo i nostri dati, a come distribuiamo la nostra elaborazione di calcolo, a come facciamo in modo che se succede qualcosa, le persone possano continuare a lavorare”, continua Wike.

share-dreamworks

La gestione dei dati ha svolto un ruolo chiave nel preparare DreamWorks a queste evenienze. Quando la compagnia è stata fondata 25 anni fa, ogni artista aveva un set di dati sulla propria postazione di lavoro. Producevano lì i loro lavori e i dati passavano all’artista successivo nel flusso di lavoro. I dati erano molto isolati, fino a quando l’azienda non è passata a cluster di archiviazione condivisi ad alte prestazioni.

Per aumentare l’agilità e supportare la collaborazione tra artisti, DreamWorks ha adottato un ambiente cloud multi-tenant e desktop virtuali per rendere la workstation e il flusso di lavoro di ogni artista accessibile ovunque all’interno dello studio. Man mano che l’ambiente diventava più complesso, l’importanza del monitoraggio cresceva. Alcuni anni fa, l’IT ha intrapreso un’importante ristrutturazione dello studio che includeva la strumentazione di tutto il suo codice. Il monitoraggio doveva mostrare esattamente cosa stava accadendo nell’ambiente in ogni momento.

Gli analytics e l’automazione erano importanti tanto quanto il monitoraggio stesso. Come altri produttori che cercano di eseguire la manutenzione predittiva sulle proprie apparecchiature prima che la produzione si interrompa a causa di tempi di inattività non pianificati, DreamWorks, ad esempio, deve immediatamente notare che un particolare servizio o file sta subendo un’elevata latenza in modo che i tecnici possano lavorare sull’applicazione e modificare il modo in cui questa accede ai dati prima che influisca sull’esperienza dell’utente finale. “L’obiettivo per noi è che gli ingegneri inventino il futuro, non che monitorino una rete o un sistema di archiviazione.”

L’importanza di AIOps

È qui che entra in gioco AIOps. DreamWorks utilizza NetApp per eseguire transazioni sintetiche che replicano i flussi di lavoro degli artisti per stabilire una linea di base e quindi gli algoritmi di machine learning cercano anomalie e forniscono avvisi. Ad esempio, dice Wike, se si decide di aver bisogno di 150.000 persone animate in una scena di folla e si vuole renderizzare tutto in una volta, ciò potrebbe impattare negativamente sulle performance. Il compito dell’IT, quindi, è soddisfare tali esigenze e apportare modifiche all’ambiente di produzione per mantenere costanti le prestazioni.

“Non vogliamo che gli artisti si accorgano che la performance di qualcosa è cambiata”, dice Miller. “Vogliamo che la nostra transazione sintetica e il nostro framework di monitoraggio ci avvisino prima che gli artisti si accorgano che qualcosa sta andando nella  direzione sbagliata. In passato, quando c’era un problema, forse un ingegnere lo notava perché lo stava cercando, o forse il sistema inviava un avviso e un ingegnere andava a indagare”, aggiunge Miller. “Ora un problema emerge quasi sempre con una raccomandazione e, in molti casi, una soluzione prima che l’ingegnere sia coinvolto nella sua ricerca. Tutto questo ci consente di far funzionare il supporto 24×7, con molti meno interventi umani al sistema”.

Creazione di continuità, collaborazione, monitoraggio e analisi dei dati: il tutto combinato per consentire allo studio di passare quasi senza problemi a un ambiente di lavoro da casa quando si è reso necessario. A parte alcuni flussi di lavoro con elevate dipendenze dalle risorse dello studio in sede, Miller afferma che quasi tutti i dipendenti sono stati in grado di passare al lavoro da casa come se fossero in ufficio. “Gli analytics ci hanno davvero permesso di mettere a punto il nostro ambiente quasi dall’oggi al domani. Siamo stati operativi in un paio di giorni e i nostri film sono tutti in fase di lavorazione”, conclude Miller.