Keine Sorge, wenn „Keling“ Gebühren verlangt – ein weiteres kostenloses Videoerstellungstool ist da! Das mit Spannung erwartete Videoerzeugungsmodell Vidu von Shengshu Technology ist jetzt offiziell weltweit verfügbar. Die Nutzung erfolgt über eine einfache E-Mail-Registrierung und -Anmeldung, ohne Wartezeiten für die Prüfung. Nach erfolgreicher Registrierung erhalten Benutzer 80 Punkte.
Dieser KI-Videogenerator ist nicht nur umfassend in seinen Funktionen, sondern auch einfach zu bedienen. Benutzer können mühelos hochauflösende Videos mit 4 oder 8 Sekunden Länge erstellen, mit einer Auflösung von bis zu 1080P, um den Anforderungen anspruchsvoller Video-Produktionen gerecht zu werden.
Die wichtigsten Highlights von Vidu:
Schnelle Generierung: Vidu erreicht branchenführende Inferenzgeschwindigkeit. Ein 4-Sekunden-Video wird in nur 30 Sekunden erstellt – doppelt so schnell wie die Konkurrenz.
Hohe Realitätsnähe: Ob Anime-Stil oder realistische Darstellung, Vidu erzeugt lebendige und detailreiche Bilder. Die Bewegungen der Figuren sind natürlich und flüssig, selbst bei starken Bewegungen kommt es nicht zu Bildfehlern.
Konsistente Charaktere: Vidu unterstützt die Funktion der Charakterkonsistenz. Nach dem Hochladen eines Charakterbildes kann dieser in beliebigen Szenen beliebige Aktionen ausführen. Die Erstellung von Memes und Emojis wird zum Kinderspiel.
Unterstützung verschiedener Stile: Neben realistischen Stilen unterstützt Vidu auch die Generierung von Anime-Videos mit einem Zeichenstil, der an Hayao Miyazaki erinnert, und bietet viel Raum für Fantasie.
Direkte Text-zu-Video-Konvertierung: Dank innovativer Architektur wirkt das Ergebnis von Vidu wie aus einem Guss. Das Video wird von Anfang bis Ende kontinuierlich generiert, ohne sichtbare Frame-Interpolationsspuren.
Vielfältige Anwendungsszenarien: Von der Spieleentwicklung und Postproduktion im Filmgeschäft bis hin zu Bildung und Training – Vidu bietet umfassende Unterstützung.
Im Vergleich zu Produkten wie Keling und Luma zeichnet sich Vidu durch die einzigartigen Funktionen der Charakterkonsistenz und des Anime-Stils aus.
Hier wurde von AIbase eine zuvor erstellte flache Illustration zum Test verwendet. Solche Bilder sind auf Plattformen wie Keling schwer zu verarbeiten, und Gesichter neigen schnell zu Verzerrungen.
Die Benutzeroberfläche von Vidu ist einfach. Laden Sie einfach ein Bild hoch und wählen Sie den Verwendungszweck. Hier wurde der vorhandene Hintergrund des Bildes beibehalten und als Startframe verwendet. Anschließend wurde einfach auf „Generieren“ geklickt.

Eingabeaufforderung: Ein kleiner Junge planscht fröhlich in einer Pfütze, der Regen wird immer stärker.
Testergebnis:
Man sieht, dass Vidu in der Generierung von Anime-Videos im Vergleich zu Keling und ähnlichen Produkten überlegen ist. Die Bewegungen der Figuren sind normal und die Figuren sind weitgehend unverzerrt. Abgesehen von der letzten Szene, die etwas von der Eingabeaufforderung abweicht, ist der Rest des Videos brauchbar.
Um die Fähigkeiten von Vidu im Anime-Bereich weiter zu testen, hat AIbase die „ererbte Herausforderung“ verwendet: Anime-Figuren im traditionellen chinesischen Stil. Gestern wurden mit diesem Bild bereits Keling und Luma getestet, die Ergebnisse waren jedoch nicht zufriedenstellend. Anime-Figuren im traditionellen chinesischen Stil stellen für Videoerzeugungsmodelle nach wie vor eine Herausforderung dar.

Eingabeaufforderung: Der Junge fasst an seine Mütze und lacht plötzlich.
Testergebnis:
Der Prozess ist insgesamt recht flüssig, Hände und Gesicht sind kaum verzerrt. Die Figur sieht jedoch etwas weniger schön aus. Im Vergleich zu Keling ist die Verarbeitung von traditionellen chinesischen Anime-Illustrationen jedoch deutlich besser.
Auch 3D-Modelle stellt Vidu problemlos dar:
Eingabeaufforderung: Ein süßer Roboterdrache spielt mit Seifenblasen.
Auch handgezeichnete Anime-Figuren sind für Vidu kein Problem:
Eingabeaufforderung: Paar, Kuss.
Test der Charakterkonsistenz:
Hier wurde von AIbase ein zuvor generiertes Bild einer Tulpen-Schönheit als Testbild verwendet:

Testergebnis:
Eingabeaufforderung: Das Mädchen trägt ein Hanfu-Kleid im Song-Stil und geht durch eine Gasse in Südchina.
AIbase hat mehrere Videos getestet. Derzeit ist die Leistung von Vidu in Bezug auf die Charakterkonsistenz eher inkonsistent. Die generierten Videos sind relativ unscharf, und die Figuren sind manchmal verzerrt.
Es ist erwähnenswert, dass Vidu im Gegensatz zu Keling nicht mehrere Aufgaben gleichzeitig unterstützt. Wenn ein Video noch nicht abgeschlossen ist, kann keine neue Videoerstellungsaufgabe gestartet werden.

Obwohl die offizielle Werbung besagt, dass Vidu nur 30 Sekunden für die Erstellung eines 4-Sekunden-Videos benötigt, betrug die tatsächliche Bearbeitungszeit in den Tests von AIbase mindestens 2-3 Minuten. Im Vergleich zu Keling und Luma ist es jedoch deutlich schneller.
Interessierte können es selbst ausprobieren. Produkt-Adresse: https://top.aibase.com/tool/viduguanwang
Vidu wurde von einem Team unter der Leitung von Professor Zhu Jun von der Tsinghua Universität entwickelt und basiert auf der selbst entwickelten U-ViT-Architektur. Diese Architektur ist die weltweit erste, die Diffusion und Transformer kombiniert und wurde früher als die von Sora verwendete DiT-Architektur vorgestellt.
Die Innovation von Vidu liegt in der direkten und kontinuierlichen Text-zu-Video-Konvertierung. Dies vermeidet die Frame-Interpolation und -Zusammenfügung herkömmlicher mehrstufiger Verfahren, wodurch die generierten Videos flüssiger und natürlicher wirken.
Shengshu Technology wurde im März 2023 gegründet. Das Team besteht aus Kernmitgliedern des Instituts für Künstliche Intelligenz der Tsinghua Universität und verfügt über umfassende Erfahrung und Expertise in der Entwicklung multimodaler generativer großer Sprachmodelle. Seit seiner Gründung im Jahr 2023 hat das Unternehmen die Anerkennung namhafter Industrieunternehmen wie Ant Group und Qiming Venture Partners erhalten und mehrere hundert Millionen Yuan an Finanzmitteln eingeworben. Es ist damit das am höchsten bewertete Startup im Bereich multimodaler großer Sprachmodelle in China.




