Google hat offiziell sein neues Video-Generierungsmodell Veo2 veröffentlicht, um mit OpenAIs Sora zu konkurrieren. Google behauptet, dass Veo2 bei der Videogenerierung eine höhere Realitätsnähe und Detailgenauigkeit aufweist. Dieses Update verbessert nicht nur die Videoqualität, sondern verstärkt auch das Verständnis für realistische Physik sowie die feinen Unterschiede in menschlichen Bewegungen und Gesichtsausdrücken.

image.png

Die leistungsstarken Funktionen von Veo2

Google erklärt, dass Veo2 „ein besseres Verständnis der Physik der realen Welt sowie der Feinheiten menschlicher Bewegungen und Gesichtsausdrücke“ besitzt. Es ist über die VideoFX-Plattform von Google Labs verfügbar, jedoch nur auf Einladung. Benutzer müssen sich über ein Google-Formular anmelden und warten, bis Google ihnen für einen begrenzten Zeitraum Zugriff gewährt.

Google zufolge können Benutzer den Typ, die Kameraeinstellungen und die Filmeffekte des Videos nach Bedarf auswählen. Veo2 kann Videos mit einer Auflösung von bis zu 4K generieren.

Im Vergleich dazu ist die Originalversion von Veo weiterhin über Vertex AI verfügbar. Von Veo2 generierte Videos werden mit Googles Metadaten-Wasserzeichen SynthID versehen, um sie als KI-generierte Inhalte zu identifizieren.

Trotz der technischen Fortschritte von Veo2 räumt Google ein, dass das Modell gelegentlich „Halluzinationen“ aufweist, z. B. die Generierung von zusätzlichen Fingern. Insgesamt sind die Halluzinationen im Vergleich zur Vorgängerversion jedoch reduziert.

Google erklärt, dass in internen Tests, bei denen sowohl die „Gesamtpräferenz“ (d. h. welche Videos die Zuschauer bevorzugten) als auch die „zeitnahe Einhaltung“ (die Übereinstimmung des Videos mit den Anweisungen des menschlichen Erstellers) bewertet wurden, menschliche Bewerter Veo gegenüber Sora und anderen KI-Modellen der Konkurrenz bevorzugten.

Zugang zu Veo2: https://labs.google/fx/tools/video-fx

Einführung: https://deepmind.google/technologies/veo/veo-2/

KI-Videogenerierung benötigt weiterhin Anstrengungen

Obwohl die KI-Videogenerierungstechnologie ständig Fortschritte macht, ist der Wettbewerb zwischen großen Unternehmen wie Google und OpenAI weiterhin intensiv. Auch einige kleinere Unternehmen wie RunwayML und Luma AI entwickeln ständig neue Funktionen, um ihre Videogenerierungsfähigkeiten zu verbessern.

Kürzlich hat RunwayML erweiterte Steuerungsfunktionen für das Gen-3Alpha Turbo-Modell eingeführt, während Pika Labs Pika 2.0 veröffentlicht hat, mit dem Benutzer eigene Charaktere zu Videos hinzufügen können.

Das Vertrauen der Benutzer in KI-generierte Videos ist jedoch nach wie vor gering. Die Veröffentlichung von Sora hat die Zweifel nicht vollständig ausgeräumt, wobei einige Benutzer von physikalischen und anatomischen Ungereimtheiten in den Ergebnissen berichten. Darüber hinaus äußerten die Zuschauer bei einer kürzlich stattgefundenen Spielepreisverleihung ihre Unzufriedenheit mit dem „KI-Chaos“ von KI-generierten Inhalten.

Google gibt an, dass viele Benutzer, insbesondere YouTube-Ersteller, großes Interesse an Veo2 zeigen und VideoFX bereits verwenden, um Hintergründe für ihre Kurzvideos zu erstellen und so Zeit zu sparen.

Update von Imagen3 

Neben Veo2 hat Google auch sein Bildgenerierungsmodell Imagen3 aktualisiert und die Realitätsnähe und die Farbbrillanz der generierten Bilder weiter verbessert. Die neue Version von Imagen3 kann verschiedene Kunststile, von fotorealistischem Stil über Impressionismus bis hin zu abstrakten und Anime-Stilen, genauer darstellen. Gleichzeitig folgt das Modell den Anweisungen der Benutzer noch besser.

Wichtigste Punkte:

- 🎥 Google veröffentlicht das Veo2-Videogenerierungsmodell und behauptet, dass die Videoqualität besser ist als die von OpenAIs Sora.

- 🚀 Benutzer können über ein Google-Formular die Nutzung von Veo2 beantragen und bei der Videogenerierung Stil und Effekte auswählen.

- 🎨 Das aktualisierte Bildgenerierungsmodell Imagen3 kann verschiedene Kunststile besser darstellen, und die Benutzerfreundlichkeit wurde verbessert.