A metà gennaio, durante il World Economic Forum di Davos, per la prima volta nella storia il palco principale è stato riservato a Sam Altman, CEO di OpenAI. Uno dei segnali che la quinta rivoluzione industriale è già iniziata e riguarda soprattutto l’avvento delle intelligenze artificiali, ribadito oggi dal lancio di una nuova AI generativa: Sora.
Il laboratorio di ricerca sull’intelligenza artificiale costituito dalla società no-profit OpenAI, Inc. e dalla sua sussidiaria for-profit OpenAI, L.P., ha condiviso sul proprio sito ufficiale i primi dettagli di quella che punta ad essere la nuova rivoluzione dal mondo delle intelligenze artificiale: dopo testi, immagini e suoni, ora è stata presentata una AI in grado di generare video a partire da comandi di testo.
Come funziona Sora, l’AI per i video
“Stiamo insegnando alle AI a capire e simulare il mondo fisico in movimento, con lo scopo di allenare modelli che possano aiutare le persone a risolvere problemi che richiedono interazione con il mondo reale”. Sora è un modello text-to-model che può generale video per ora di massimo 60 secondi e il più possibile aderenti al prompt che viene fornito.
Tra i vari esempi, è stato chiesto alla AI di generare un video di una persona che cammina per le strade di Tokyo mentre nevica. Ne viene descritto nei dettagli l’aspetto e l’atmosfera e questo qui sotto è il risultato elaborato dalla AI.
Prompt: “A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. she wears a black leather jacket, a long red dress, and black boots, and carries a black purse. she wears sunglasses and red lipstick. she walks confidently and casually.… pic.twitter.com/cjIdgYFaWq
— OpenAI (@OpenAI) February 15, 2024
Un altro video mostra invece una tenera creatura in stile Pixar mentre è intenta a studiare e giocare con una candela accesa. In questo caso, i responsabili del progetto hanno specificato che il sistema ha lavorato da solo sulla giusta consistenza della pelliccia in movimento trovando la maniera migliore per presentarla, cosa che ai tecnici umani sarebbe riuscita solo con mesi di lavoro.
Prompt: “Animated scene features a close-up of a short fluffy monster kneeling beside a melting red candle. the art style is 3d and realistic, with a focus on lighting and texture. the mood of the painting is one of wonder and curiosity, as the monster gazes at the flame with… pic.twitter.com/aLMgJPI0y6
— OpenAI (@OpenAI) February 15, 2024
Sora al momento è in grado di creare scene complesse con diversi personaggi, specifici movimenti, accurati dettagli non solo nel soggetto ma anche nello sfondo, ma ha anche creato video che sfruttano diverse angolazioni e tagli di montaggio che addirittura non erano stati richiesti.
I rischi dell’AI generativa Sora
Al momento, Sora non è disponibile per il pubblico. Un gruppo di esperti sta infatti lavorando per studiarne le caratteristiche e i possibili punti deboli in materia di rischi e sicurezza. Come successo per altre AI generative, si cerca infatti di limitarne i potenziali usi sconsiderati.
Prima di renderla pubblica, rendono noto da OpenAI, serviranno ancora diversi step. Per garantirne la sicurezza, il piano è quello limitazioni simili a quelle sfruttate per DALL·E 3 (tecnologia per la creazione di immagini ora disponibile anche su ChatGpt) che impediscano di ricreare violenze, immagini pornografiche o persone reali.
Leggi anche: Intelligenza Artificiale: crescita record in Italia. In 10 anni sostituirà 3,8 milioni di posti di lavoro
Dai deepfake alla disinformazione in ambito politico, economico e sociale, sono tanti gli aspetti che preoccupano nel ricordo a queste tecnologie, che da tempo preoccupano soprattutto gli operatori del settore audiovisivo. OpenAI nella sua presentazione rassicura visual artists, designer e filmmakers di aggiornare tutti sui progressi che questo modello farà nel campo, per trovare il modo in cui potrà essere utile ai professionisti del settore.
© Riproduzione riservata