Google DeepMind hat die Einführung einer revolutionären „Präzisen Bearbeitung“-Funktion für sein führendes KI-Videoerstellungsmodell Veo angekündigt. Diese Funktion ermöglicht es Benutzern, Elemente wie Gegenstände, Figuren oder Hintergrundobjekte in bestehenden Videos einfach hinzuzufügen oder zu entfernen, indem sie einfache Textanweisungen verwenden, während die Szene intelligent rekonstruiert wird, um physische Realismus und visuelle Kohärenz sicherzustellen und die Integrität des Originalvideos perfekt zu bewahren.

Laut AIbase markiert dieses Update eine Verschiebung der KI-Video-Bearbeitung von grober Generierung zu verfeinerter Nachbearbeitung und verbessert die Produktionseffizienz für Kreative auf der Flow-Plattform erheblich. Die präzise Bearbeitungsfunktion von Veo ist Teil der Veo3.1-Verbesserung und wurde speziell für Google's KI-Filmwerkzeug Flow entwickelt. Sie nutzt fortschrittliche generative KI-Algorithmen, die Lichtverhältnisse, Proportionen, Objektinteraktionen und Bewegungspfade berücksichtigen, um nahtlose Modifikationen zu erreichen.

Zum Beispiel können Benutzer anweisen „Füge einen gelben Schulbus in die Szene hinzu“ oder „Entferne einen Fußgänger am Straßenrand“, und das Modell füllt automatisch den Hintergrund aus, passt Schatten an und erhält eine konsistente Kamera-Bewegung, wodurch übliche Probleme wie „Bildsprünge“ oder unnatürliche Spuren, die in traditioneller Bearbeitungssoftware vorkommen, vermieden werden. In dem Demonstrationsvideo zeigte die Funktion den gesamten Prozess vom statischen Bild bis zur dynamischen Mehrkameraszene, sodass Benutzer ihre Inhalte in nur ein paar Sekunden iterieren können, ohne neu drehen oder manuell Masken erstellen zu müssen.

 Laut Analyse von AIbase umfassen die Kerninnovationen von Veo3.1 verbesserte Audio-Synchronisation, Multi-Prompt-Szenenerstellung und native 1080p-Ausgabe, wobei die Video-Länge bis zu einer Minute verlängert werden kann. Dies macht die präzise Bearbeitung nicht nur für Kurzfilm-Ersteller geeignet, sondern auch für Werbung, Marketing und Unternehmensschulungen. Zum Beispiel können Benutzer in Flow „Komponenten“ (wie vordefinierte Figuren oder Stilreferenzen) hochladen und dann durch präzise Bearbeitung Szenen erweitern, um automatisierte Übergänge von einzelnen Bildern zu vollständigen Storyboards zu erreichen. Im Vergleich zur vorherigen Version Veo3 verbessert diese Version die Charakterkonsistenz und Erzählkontrolle um über 30 %, mit Benchmark-Tests, die eine Bearbeitungsgenauigkeit von 95 % zeigen, was deutlich besser ist als Konkurrenten wie OpenAI's Sora2. „Die präzise Bearbeitung verwandelt die KI-Video-Erstellung tatsächlich in etwas, das jeder nutzen kann, ohne professionelle Fähigkeiten zu besitzen.“