Shengshu Technology kündigt heute an, dass die Q1-Referenzbildfunktion des Video-Modells Vidu für öffentliche Benutzer verfügbar ist. Die Einführung dieser Funktion zielt darauf ab, die technischen Engpässe der Mehrheitskonsistenz zu überwinden, den geschäftlichen Produktionszyklus von AI-Bild- und Videogenerierung abzuschließen und den AI-Multimodal-Kreativitätsprozess in eine neue Phase zu führen.
Die Einführung der Referenzbildfunktion von Vidu Q1 basiert auf „fünf Highlights“. Zunächst unterstützt Vidu Q1 das gleichzeitige Eingeben von bis zu 7 Referenzbildern, was die Kontrollierbarkeit im Kreativprozess deutlich verbessert. Zweitens zeigt Vidu Q1 eine stärkere Konsistenz bei der Generierung von mehreren Subjekten und Szenen. Unabhängig davon, ob mehrere Generierungen durchgeführt werden, bleiben Gesicht und Merkmale der Personen und Objekte konstant, was eine hohe Wiederherstellungsgenauigkeit und Realitätssensibilität gewährleistet. Darüber hinaus kann der Benutzer mit nur einem Bild und einem Prompt frei Kleidung und Hintergrund wechseln und somit eine hochfreie Kreation ermöglichen.
Shengshu Technology erklärt, dass die Einführung der Referenzbildfunktion von Vidu Q1 ein bedeutender Durchbruch in der Konsistenztechnologie darstellt. Sie ermöglicht es den Nutzern, flexibel zu kreativieren, auch in komplexen Szenarien, und verstärkt die Realitätsfähigkeit und Anwendbarkeit der Bildgenerierung. In der Vergangenheit waren die meisten AI-Kreativwerkzeuge darauf ausgelegt, Inspiration zu wecken, während Vidu Q1 die Rolle der AI auf den Hauptakteur der Inhaltsproduktion ausweitet. Der Benutzer muss nur überwachen, wodurch der Zugang zur Inhaltsproduktion stark reduziert wird.
In Bezug auf praktische Anwendungen bietet Vidu Q1 drei Generierungsmodi: Synthese, Ersetzung und Transformation. Zum Beispiel können verschiedene Personen in einer Szene zusammengefasst werden oder der Hintergrund eines bestehenden Fotos in eine neue Szene geändert werden, um so personalisierte Inhalte einfach zu generieren. Darüber hinaus hat dieses Werkzeug großes Potenzial in Bereichen wie Kleidungsgestaltung, Werbung und kreativer Marketing, da es Designern und E-Commerce schnell hochwertige Materialien produzieren kann.
Shengshu Technologies Innovation markiert einen neuen Meilenstein in der kommerziellen Anwendung von AI-Bildgenerierungswerkzeugen. Das Unternehmen möchte mit dieser Technologie die Branche dazu bringen, eine neue Ära der Multimodal-Kreativität einzuleiten und tatsächlich das Ziel zu erreichen, AI-Technologie als Produktivitätsmotor zu nutzen.