Im Bereich der KI-Video-Technologie gibt es eine große Innovation – das Vidu Q1-Video-Modell von Shengshu Technology hat seine Referenzfunktion offiziell gestartet. Mit einer revolutionären Erfahrung, bei der „aus der Vorstellung direkt Video-Material entsteht“, wird die technische Grenze und Produktivität der Inhaltsproduktion neu definiert.

Bei traditionellen Video-Produktionsprozessen müssen Kreatoren verschiedene komplexe Schritte durchlaufen, wie das Verfassen von Drehbüchern, die Gestaltung von Figuren, das Zeichnen von Szenen, das Drehen vor Ort und die Nachbearbeitung. Die Entstehung eines kurzen Films dauert oft mehrere Wochen oder sogar Monate. Die Einführung der Referenzfunktion von Vidu Q1 zerbricht jedoch vollständig dieses etablierte Modell. Benutzer müssen nur Referenzbilder für Personen, Gegenstände und Szenen hochladen, und das System generiert innerhalb von Minuten Video-Material, das mehrere Elemente integriert, wodurch „kein Szenenplan erforderlich ist“. Zum Beispiel können mit zwei Bildern von Western-Figuren, zwei Szenenbildern und zwei Revolver-Bildern direkt Szenen aus einem Western-Film erstellt werden, wobei Fernszenen, Nahaufnahmen und Handlungsfortschritte nahtlos verlaufen, ohne dass irgendeine manuelle Szenenplanung erforderlich ist.

WeChat-Screenshot_20250708173704.png

Diese Innovation vereinfacht nicht nur den kreativen Prozess, sondern bietet Kreaturen auch eine bisher unerreichte Flexibilität. Die hochgeladenen Materialbibliotheken wirken wie ein „virtuelles Filmteam“, und Benutzer können Personen, Szenen und Gegenstände frei kombinieren. Durch das Ändern einzelner Elemente kann der Erzählfluss der Kameraeinstellungen nahtlos wechseln. Zum Beispiel kann dieselbe Western-Figur in der einen Sekunde über die Prärie galoppieren und in der nächsten Sekunde bereits im Bar sitzen und einen Drink von einer Frau entgegennehmen. Die Handlung entwickelt sich natürlich weiter, und die Beziehungen zwischen den Figuren werden stufenweise tiefer.

Auf kommerzieller Ebene zeigt die Referenzfunktion von Vidu Q1 eine starke Anpassungsfähigkeit. Angesichts der strengen Anforderungen an die Konsistenz von Hauptfiguren in Bereichen wie E-Commerce, Werbung und IP-Entwicklung unterstützt diese Funktion bis zu 7 Hauptfiguren gleichzeitig und stellt sicher, dass die Konsistenz in Szenen mit mehreren Figuren und Interaktionen sowie bei der Darstellung von Produkten hoch ist. Zum Beispiel kann ein Markenunternehmen „Anne Hathaway“ als Botschafterin für verschiedene Produkte einsetzen, vom rosa Tesla bis zum Eiswürfel-Tee von Mochi Ice Cream. Die Produktmerkmale werden immer genau wiedergegeben, und die Kosten für einen 5 Sekunden langen 1080P-Video betragen nur 9 Cent, was ein Zehntel des Preises traditioneller Urheberrechts-Materialien beträgt. Wenn ein 48-minütiges Serienmaterial erstellt wird, kostet es etwa 1000 Yuan, was deutlich günstiger ist als maßgeschneiderte Urheberrechts-Materialien.

Auf technischer Ebene hat Vidu Q1 umfassende Verbesserungen in den Bereichen Bildqualität, Kamerabewegung und Animationstil erzielt: Es unterstützt direkte Ausgabe in 1080P-HD-Qualität, bei der die Details so gut sind wie in Filmproduktionen; die Funktion der ersten und letzten Bildbewegung benötigt nur zwei Bilder, um eine Meisterklasse-Kamerakunst zu generieren; die Animationstil-Vielfalt ist größer und die dynamische Bewegungsfähigkeit ist deutlich verbessert; zudem wurde eine AI-Audiospur-Funktion hinzugefügt, die es ermöglicht, eigene Soundeffekte in einem Schritt zu generieren und mehrere Soundeffekte zu überschneiden, um den gesamten professionellen Erstellungsprozess abzudecken.