Le modèle vidéo Sora, publié par OpenAI, repousse les limites de la génération de longues vidéos par intelligence artificielle. Son rapport technique dévoile des innovations dans son entraînement et sa génération. Sora possède des capacités exceptionnelles : simulation du monde réel, connexion entre les vidéos et génération de vidéos étendues. Il utilise une architecture Transformer, combinée à des technologies telles que ChatGPT et DALL·E 3.
Ce modèle marque un tournant dans le domaine de l'IA, annonçant une nouvelle ère pour la génération de vidéos longues.