Tora ist ein auf Diffusions-Transformatoren (DiT) basierendes Videogenerierungsmodell. Durch die Integration von Text-, Bild- und Trajektorienbedingungen ermöglicht es eine präzise Steuerung der Videodynamik. Toras Design nutzt die Skalierbarkeit von DiT optimal aus und erlaubt die Generierung hochwertiger Videoinhalte mit unterschiedlichen Laufzeiten, Seitenverhältnissen und Auflösungen. Das Modell zeichnet sich durch hohe Bewegungstreue und realistische Simulation von Bewegungen in der physischen Welt aus und eröffnet neue Möglichkeiten für die Videoproduktion.