Sora es un modelo de generación de video a partir de texto desarrollado por OpenAI, capaz de generar secuencias de imágenes realistas de hasta un minuto de duración basándose en descripciones textuales. Posee la capacidad de comprender y simular el movimiento en el mundo físico, con el objetivo de entrenar un modelo que ayude a las personas a resolver problemas que requieran interacción con objetos físicos. Sora puede interpretar indicaciones extensas y generar, a partir de texto, diversas imágenes de personas, animales, paisajes y escenas urbanas. Su desventaja radica en la dificultad para representar con precisión la física de escenas complejas y para comprender las relaciones causa-efecto.