Il mercato dei software di intelligenza artificiale generativa dedicati al video è ancora immaturo, ma in grande fermento. Attualmente il leader è Runway AI, azienda che ha saputo sfruttare la ricerca in questo ambito per mettere a punto un prodotto completo per la creazione text to video e image to video come Runway. Peccato che i modelli generativi sottostanti siano ancora poco maturi.
Qualche mese fa, il mercato è stato scosso da OpenAI che ha presentato un’innovativo modello chiamato Sora, in grado di generare video fino ad un minuto da una descrizione testuale. Dagli esempi pubblicati, Sora è sorprendente per la qualità delle immagini, per la coerenza tra i fotogrammi e per la capacità di comprendere il testo. Il modello, però, non è ancora un prodotto disponibile, ma un prototipo che arriverà entro l’anno.
Non si è fatta attendere la risposta cinese arrivata dall’azienda tecnologica Kuaishou che ha svelato Kling AI, un modello in grado di generare clip fino ad una risoluzione di 1080p a 30fps, con una durata massima di due minuti. Anche in questo caso, abbiamo visto degli esempi, ma la possibilità di utilizzarlo è ancora riservata a pochi beta tester.
Pochi giorni fa è arrivato Dream Machine dell’azienda Luma, già nota per il suo lavoro sulla creazione di elementi e ambienti tridimensionali. Si tratta di un software, in parte gratuito, immediatamente utilizzabile per la creazione di video di 5 secondi a partire da un testo o da un’immagine. Ha una qualità mediamente più elevata delle soluzioni attuali, anche se al momento presenta un’interfaccia scarna senza grandi controlli. Nel mio video tutorial vi mostro come funziona. Buona visione!