© 2000-2023 - Enkey Magazine - Tutti i diritti riservati
ENKEY SNC - P.IVA IT03202450924 / Cod. REA CA253701 - Tel. 078162719
Sora è la nuova intelligenza artificiale di Open AI. Essa è in grado di generare video da un testo (text to video), ma al momento è solamente prodotto di ricerca. Scopriamola insieme.
Open AI presenta Sora
Open AI si è ormai affermata come leader del settore dell’intelligenza artificiale generativa, sebbene la concorrenza sia sempre più convincente. Con l’ultimo annuncio di Open AI, la società di intelligenza artificiale si spinge oltre e presenta Sora, la prima AI text to video, in grado di generare video altamente realistici partendo da un prompt testuale.
Al momento Sora è solamente un prodotto di ricerca e l’azienda non ha comunicato quando questo sarà disponibile al grande pubblico. Nonostante ciò la nuova AI è stata ufficialmente presentata al mondo e l’azienda promette che in una data non ancora precisata sarà disponibile per tutti coloro che vorranno cimentarsi con questa nuova esperienza.
AI text to video: Sora è altamente realistica
In realtà Open AI non è la prima azienda a presentare un modello di intelligenza artificiale generativa text to video, ma secondo quando affermato dall’azienda stessa Sora si distingue dagli altri per il suo incredibile fotorealismo.
Al momento non è possibile testare il modello di AI ma, in effetti, gli esempi mostrati al grande pubblico sembrano sorprendentemente realistici.
Un altro aspetto che distinguerebbe Sora dagli altri modelli text to video sarebbe la durata di un filmato. Secondo l’azienda l’AI sarebbe in grado di creare video lunghi fino a un minuto, anche se non sappiamo quante stringhe di testo servirebbero effettivamente per creare un video lungo un minuto.
L’intelligenza artificiale diventa regista
L’intelligenza artificiale corre a una velocità impressionante. Sembra ieri che ci sorprendevamo nel sentire un chatbot rispondere alle nostre domande e oggi ci troviamo già a vederlo vestire i panni da regista.
Probabilmente ci vorrà ancora molto prima di essere in grado di vedere al cinema un film interamente generato dall’intelligenza artificiale, ma non escludiamo che ciò potrebbe in futuro accadere.
Ma la cosa davvero sorprendente non è la realizzazione di video di per sé ma il fatto che l’intelligenza artificiale sia in grado di comprendere un mondo in movimento.
Fino a quando parlavamo di generare immagini statiche era un discorso. Ma oggi il modello riesce a capire come i personaggi si muovono e compiono azioni e ciò è sorprendente.
Secondo quanto affermato da Open AI Sora rappresenta un passo evolutivo dell’intelligenza artificiale generativa. Generare video fotorealistici equivale a insegnare all’intelligenza artificiale come comprendere e simulare un mondo in movimento.
Gli esempi mostrati da Open AI
Come dicevamo non è possibile testare Sora al momento, ma Open AI ha mostrato alcuni esempi che sono davvero impressionanti dal punto di vista fotorealistico.
C’è un video che mostra una donna che cammina a Tokyo di notte, un altro che mostra un branco di mammut che corrono nella neve e un terzo che mostra un cammina da un davanzale all’altro.
Nel video dei mammut la neve che si alza da terra mostra chiaramente il peso degli animali che corrono e la loro pelliccia si muove nel vento. Nell’ultimo video, invece, quello del cane, quando questo salta da un davanzale all’altro non da la sensazione di volare, ma l’intelligenza artificiale è stata in grado di mostrare nella sua rappresentazione la forza di gravità.
Sora: quando sarà disponibile al pubblico?
Al momento Sora è solamente un prodotto di ricerca. Prima di renderlo disponibile al grande pubblico il modello dovrà superare tutti i test riguarda a eventuali problemi e rischi, soprattutto per quanto riguarda un uso improprio del prodotto.
Open AI ha spiegato: “Prima di rendere Sora disponibile nei prodotti di Open AI, adotteremo diverse misure di sicurezza importanti. Stiamo lavorando con i red teamer che testeranno il modello in modo approfondito.
Stiamo anche costruendo strumenti per aiutare a rilevare i contenuti fuorvianti, come un classificatore di rilevamento in grado di dire quando un video è stato generato da Sora”.