Das Flaggschiff-Videoerstellungsmodell von Google Veo3 ist nun für Entwickler über den Gemini API verfügbar und bietet die Funktion zur Text-zu-Video-Umwandlung sowie die Synthese von Audio. Dieser Schritt markiert eine neue Phase im AI-Video-Produktionsbereich, bringt aber auch höhere Kosten mit sich.

Veo3 ist das erste Modell von Google, das hochauflösende Videos anhand eines einzelnen Textprompts erstellen und gleichzeitig Dialoge, Musik und Geräusche synchronisieren kann. Derzeit steht der Gemini API nur die Funktion zur Text-zu-Video-Umwandlung zur Verfügung, doch Google kündigte an, dass auch die Bild-zu-Video-Funktion, die bereits in der Gemini-Anwendung verfügbare ist, bald folgen wird.

QQ20250718-085316.png

Für Entwickler, die die fortgeschrittene Videoerstellung in ihre eigenen Anwendungen integrieren oder Prototypen für die Produktion bauen möchten, bietet diese API-Integration eine große Unterstützung. Google AI Studio stellt Entwicklern SDK-Vorlagen und Einstiegsanwendungen zur Verfügung, um sie schnell ins System einzuführen. Um auf diese API zuzugreifen, ist ein aktives Google Cloud-Projekt mit aktivierter Abrechnungsfunktion erforderlich. Google gab bekannt, dass Veo3 bereits in der Gemini-Anwendung, Flow und Vertex AI Millionen Mal genutzt wurde.

Doch der Preis von Veo3 macht es zu einer relativ teuren Option im Bereich der KI-Videoerstellung. Veo3 ist über den Gemini API nur in Google Cloud-Zahlungspaketen verfügbar. Als Beispiel: Ein 720p-Video mit 24 fps (mit 16:9-Audio) kostet 0,75 US-Dollar pro Sekunde, was 25 Cent mehr ist als bei Veo2 ohne Audio. Das bedeutet, ein achtsekündiges Video kostet 6 US-Dollar und ein fünfmnützliches Video bis zu 225 US-Dollar. Da normalerweise mehrere Versuche notwendig sind, um das gewünschte Ergebnis zu erzielen, können die tatsächlichen Kosten schnell ansteigen. Zum Beispiel, wenn zehnfach so viel Material benötigt wird, um ein fünfminütiges nutzbares Video zu erstellen, beträgt die Gesamtkosten 2.250 US-Dollar. Trotzdem könnte Google denken, dass dies in bestimmten Anwendungsfällen immer noch kosteneffizienter ist als die traditionelle Videoproduktion. Google kündigte außerdem den „Veo3Fast“-Modus an, der schneller und günstiger ist, aber derzeit noch nicht in der API verfügbbar ist.

Derzeit konzentriert sich die Anwendung von Veo3 hauptsächlich auf professionelle Bereiche. Zum Beispiel verwendet Cartwheel Veo3, um 2D-Videos in realistische 3D-Rollenanimationen umzuwandeln und die generierten Bewegungen auf die Montagemodelle der Kundenaufträge abzubilden. Das Game-Studio Volley