Sofort einsatzbereit! Das von Tsinghua entwickelte Sora ist offiziell online! Vidu Video-Generator im Test, Anime-Effekte übertreffen Co-Ling

AIbase基地

Veröffentlicht amKI-Nachrichten und -Informationen · 10 Minuten Lesezeit · Jul 30, 2024

1.0k

Keine Sorge, wenn „Keling“ Gebühren verlangt – ein weiteres kostenloses Videoerstellungstool ist da! Das mit Spannung erwartete Videoerzeugungsmodell Vidu von Shengshu Technology ist jetzt offiziell weltweit verfügbar. Die Nutzung erfolgt über eine einfache E-Mail-Registrierung und -Anmeldung, ohne Wartezeiten für die Prüfung. Nach erfolgreicher Registrierung erhalten Benutzer 80 Punkte.

Dieser KI-Videogenerator ist nicht nur umfassend in seinen Funktionen, sondern auch einfach zu bedienen. Benutzer können mühelos hochauflösende Videos mit 4 oder 8 Sekunden Länge erstellen, mit einer Auflösung von bis zu 1080P, um den Anforderungen anspruchsvoller Video-Produktionen gerecht zu werden.

Die wichtigsten Highlights von Vidu:

Schnelle Generierung: Vidu erreicht branchenführende Inferenzgeschwindigkeit. Ein 4-Sekunden-Video wird in nur 30 Sekunden erstellt – doppelt so schnell wie die Konkurrenz.
Hohe Realitätsnähe: Ob Anime-Stil oder realistische Darstellung, Vidu erzeugt lebendige und detailreiche Bilder. Die Bewegungen der Figuren sind natürlich und flüssig, selbst bei starken Bewegungen kommt es nicht zu Bildfehlern.
Konsistente Charaktere: Vidu unterstützt die Funktion der Charakterkonsistenz. Nach dem Hochladen eines Charakterbildes kann dieser in beliebigen Szenen beliebige Aktionen ausführen. Die Erstellung von Memes und Emojis wird zum Kinderspiel.
Unterstützung verschiedener Stile: Neben realistischen Stilen unterstützt Vidu auch die Generierung von Anime-Videos mit einem Zeichenstil, der an Hayao Miyazaki erinnert, und bietet viel Raum für Fantasie.
Direkte Text-zu-Video-Konvertierung: Dank innovativer Architektur wirkt das Ergebnis von Vidu wie aus einem Guss. Das Video wird von Anfang bis Ende kontinuierlich generiert, ohne sichtbare Frame-Interpolationsspuren.
Vielfältige Anwendungsszenarien: Von der Spieleentwicklung und Postproduktion im Filmgeschäft bis hin zu Bildung und Training – Vidu bietet umfassende Unterstützung.

Im Vergleich zu Produkten wie Keling und Luma zeichnet sich Vidu durch die einzigartigen Funktionen der Charakterkonsistenz und des Anime-Stils aus.

Hier wurde von AIbase eine zuvor erstellte flache Illustration zum Test verwendet. Solche Bilder sind auf Plattformen wie Keling schwer zu verarbeiten, und Gesichter neigen schnell zu Verzerrungen.

Die Benutzeroberfläche von Vidu ist einfach. Laden Sie einfach ein Bild hoch und wählen Sie den Verwendungszweck. Hier wurde der vorhandene Hintergrund des Bildes beibehalten und als Startframe verwendet. Anschließend wurde einfach auf „Generieren“ geklickt.

小男孩操作截图.jpg

Eingabeaufforderung: Ein kleiner Junge planscht fröhlich in einer Pfütze, der Regen wird immer stärker.

Testergebnis:

Man sieht, dass Vidu in der Generierung von Anime-Videos im Vergleich zu Keling und ähnlichen Produkten überlegen ist. Die Bewegungen der Figuren sind normal und die Figuren sind weitgehend unverzerrt. Abgesehen von der letzten Szene, die etwas von der Eingabeaufforderung abweicht, ist der Rest des Videos brauchbar.

Um die Fähigkeiten von Vidu im Anime-Bereich weiter zu testen, hat AIbase die „ererbte Herausforderung“ verwendet: Anime-Figuren im traditionellen chinesischen Stil. Gestern wurden mit diesem Bild bereits Keling und Luma getestet, die Ergebnisse waren jedoch nicht zufriedenstellend. Anime-Figuren im traditionellen chinesischen Stil stellen für Videoerzeugungsmodelle nach wie vor eine Herausforderung dar.

古风美男操作截图 (1).jpg

Eingabeaufforderung: Der Junge fasst an seine Mütze und lacht plötzlich.

Testergebnis:

Der Prozess ist insgesamt recht flüssig, Hände und Gesicht sind kaum verzerrt. Die Figur sieht jedoch etwas weniger schön aus. Im Vergleich zu Keling ist die Verarbeitung von traditionellen chinesischen Anime-Illustrationen jedoch deutlich besser.

Auch 3D-Modelle stellt Vidu problemlos dar:

Eingabeaufforderung: Ein süßer Roboterdrache spielt mit Seifenblasen.

Auch handgezeichnete Anime-Figuren sind für Vidu kein Problem:

Eingabeaufforderung: Paar, Kuss.

Test der Charakterkonsistenz:

Hier wurde von AIbase ein zuvor generiertes Bild einer Tulpen-Schönheit als Testbild verwendet:

1_1714287429137_ai2023_A_beautiful_Chinese_girl_with_a_sweet_smile_wearing_a_ye_6586d6d4-4754-4dac-b308-cd3b22b52bed.png

Testergebnis:

Eingabeaufforderung: Das Mädchen trägt ein Hanfu-Kleid im Song-Stil und geht durch eine Gasse in Südchina.

AIbase hat mehrere Videos getestet. Derzeit ist die Leistung von Vidu in Bezug auf die Charakterkonsistenz eher inkonsistent. Die generierten Videos sind relativ unscharf, und die Figuren sind manchmal verzerrt.

Es ist erwähnenswert, dass Vidu im Gegensatz zu Keling nicht mehrere Aufgaben gleichzeitig unterstützt. Wenn ein Video noch nicht abgeschlossen ist, kann keine neue Videoerstellungsaufgabe gestartet werden.

QQ截图20240730115425.jpg

Obwohl die offizielle Werbung besagt, dass Vidu nur 30 Sekunden für die Erstellung eines 4-Sekunden-Videos benötigt, betrug die tatsächliche Bearbeitungszeit in den Tests von AIbase mindestens 2-3 Minuten. Im Vergleich zu Keling und Luma ist es jedoch deutlich schneller.

Interessierte können es selbst ausprobieren. Produkt-Adresse: https://top.aibase.com/tool/viduguanwang

Vidu wurde von einem Team unter der Leitung von Professor Zhu Jun von der Tsinghua Universität entwickelt und basiert auf der selbst entwickelten U-ViT-Architektur. Diese Architektur ist die weltweit erste, die Diffusion und Transformer kombiniert und wurde früher als die von Sora verwendete DiT-Architektur vorgestellt.

Die Innovation von Vidu liegt in der direkten und kontinuierlichen Text-zu-Video-Konvertierung. Dies vermeidet die Frame-Interpolation und -Zusammenfügung herkömmlicher mehrstufiger Verfahren, wodurch die generierten Videos flüssiger und natürlicher wirken.

Shengshu Technology wurde im März 2023 gegründet. Das Team besteht aus Kernmitgliedern des Instituts für Künstliche Intelligenz der Tsinghua Universität und verfügt über umfassende Erfahrung und Expertise in der Entwicklung multimodaler generativer großer Sprachmodelle. Seit seiner Gründung im Jahr 2023 hat das Unternehmen die Anerkennung namhafter Industrieunternehmen wie Ant Group und Qiming Venture Partners erhalten und mehrere hundert Millionen Yuan an Finanzmitteln eingeworben. Es ist damit das am höchsten bewertete Startup im Bereich multimodaler großer Sprachmodelle in China.

20.000 Dollar für einen Haushaltsroboter? OpenAI-gefundene 1X Neo humanoiden Roboter startet Vorbestellungen, kommt 2024 in amerikanische Häuser

Die norwegische Robotikfirma 1X stellt den ersten humanoiden Haushaltsroboter Neo vor, der für 20.000 Dollar verkauft wird und eine monatliche Abonnementsgebühr von 499 Dollar hat. Der 1,68 Meter hohe Roboter ist speziell für Aufgaben wie Spülen und Aufräumen konzipiert und verwendet einen Modus mit KI und manueller Fernsteuerung, um komplexe Aufgaben zu erledigen.

AWS plant eine zusätzliche Investition von 5 Milliarden Dollar in Südkorea, um den Aufbau von KI-Datenzentren voranzutreiben

AWS gab bekannt, in den nächsten sechs Jahren in Südkorea zusätzliche 5 Milliarden Dollar investieren zu wollen, um KI-Datenzentren auszubauen und mit der SK Gruppe ein großes Infrastrukturprojekt in Ulsan zu bauen. Die gesamte Investition in Südkorea wird insgesamt 12,6 Milliarden Dollar betragen und zeigt die strategische Bedeutung des südkoreanischen Marktes für AWS.

Der Vater von DayZ vergleicht die aktuelle Angst vor KI mit der früheren Panik vor Google und Wikipedia

Die schnelle Entwicklung der KI-Technologie führt zu Veränderungen in der Gaming-Branche. Generative KI bietet neue Chancen und Herausforderungen, weshalb Unternehmen wie Microsoft und Amazon ihre Ressourcen auf KI-Anwendungen umstecken. Die Reaktionen von Spielentwicklern sind unterschiedlich, und die Zukunft der Branche ist ungewiss.

Ding Xiang Vice-Präsident Li Liang sagte, dass KI die Verbreitung von Gerüchten einfacher macht, und die Plattform verwendet gerade intelligente Systeme zur Bekämpfung von Gerüchten

Ding Xiang Vice-Präsident Li Liang betonte, dass KI leicht für die Erstellung von Gerüchten missbraucht werden kann. Die Plattform setzt aktiv KI-Technologie ein, um Gerüchte zu bekämpfen, und entwickelt ein 'Intelligentes System zur Bekämpfung von Gerüchten' und führt eine schnelle Suche im gesamten Netzwerk als Schwerpunkt der Arbeit in diesem Jahr durch.

Google präsentiert den KI-automatisierten Marketing-Tool Pomelli, mit dem Marketinginhalte durch Eingabe einer Webseiten-URL generiert werden können

Google Labs und DeepMind haben gemeinsam den KI-Tool Pomelli vorgestellt, der in den USA, Kanada, Australien und Neuseeland im öffentlichen Test betrieben wird. Dieses Tool richtet sich an kleine und mittlere Unternehmen und generiert durch intelligente Analyse des Website-Inhalts rasch soziale Medien-Marketingkampagnen, die zur Markenidentität passen, um die Marketingbarriere zu senken und professionelle Inhaltserschaffung zu ermöglichen. Die Kernfunktion besteht darin, den Unternehmens-DNA in drei Schritten aufzubauen.

US-Senatoren schlagen vor, das Nutzen von KI-Chatbot durch Minderjährige zu verbieten

Zwei US-Senatoren haben das GUARD-Gesetz vorgeschlagen, das KI-Unternehmen verpflichtet, bei der Nutzung von Chatbots die Altersverifikation der Nutzer durchzuführen und Minderjährige unter 18 Jahren den Zugang zu verbieten. Das Gesetz bezieht sich auf die Sorgen von Eltern und Sicherheitsanwälten bezüglich des Einflusses der KI auf Kinder und zielt darauf ab, Minderjährige zu schützen.

Adobe Firefly Image 5 mit erheblichen Updates: Native Generierung von 4 Millionen Pixeln, KI-Audiospuren + benutzerdefinierte Modelle — Kreative betreten die Ära der vollständigen AI-Kreation

Adobe veröffentlicht das professionelle KI-Bildgenerationsmodell Firefly Image5 und erreicht durch eine Qualitätsschwelle von 'ausreichend' bis 'professionell'. Neue Funktionen umfassen native Ausgabe von 4 Millionen Pixeln, hierarchische Prompt-Editierung, benutzerdefinierte Kunststilmodelle und KI-generierte Audiospuren. Damit wird der KI-Workflow für Bilder, Videos und Audios abgeschlossen und der kreative Arbeitsablauf neu definiert.

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

GEO Brand Visibility

AI Visibility Audit

AI Search Visibility Checker

GEO Promotion Link Detection

GEO Ranking Optimization System

GEO Services​

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

LLM API Hub

AI Models Finder

Model Providers

LLM Leaderboard

Compare LLMs

LLM Cost Calculator

LLM Arena

AI Model Compatibility Checker

AI Deployment Calculator

Sofort einsatzbereit! Das von Tsinghua entwickelte Sora ist offiziell online! Vidu Video-Generator im Test, Anime-Effekte übertreffen Co-Ling

AIbase基地

Dieser Artikel stammt aus dem AIbase-Tagesbericht

Empfohlene verwandte KI-Nachrichten

20.000 Dollar für einen Haushaltsroboter? OpenAI-gefundene 1X Neo humanoiden Roboter startet Vorbestellungen, kommt 2024 in amerikanische Häuser

AWS plant eine zusätzliche Investition von 5 Milliarden Dollar in Südkorea, um den Aufbau von KI-Datenzentren voranzutreiben

Der Vater von DayZ vergleicht die aktuelle Angst vor KI mit der früheren Panik vor Google und Wikipedia

Ding Xiang Vice-Präsident Li Liang sagte, dass KI die Verbreitung von Gerüchten einfacher macht, und die Plattform verwendet gerade intelligente Systeme zur Bekämpfung von Gerüchten

SoulX-Podcast-Modell der Soul-Sprachtechnologie: Schockierende Veröffentlichung des 90-minütigen ununterbrochenen Podcasts - AI-Sprachrevolution wird erneut verbessert

Google stellt AI-Marketing-Tool Pomelli vor: Automatisches Erstellen von Markeninhalten mit nur einer Webadresse

Google präsentiert den KI-automatisierten Marketing-Tool Pomelli, mit dem Marketinginhalte durch Eingabe einer Webseiten-URL generiert werden können

US-Senatoren schlagen vor, das Nutzen von KI-Chatbot durch Minderjährige zu verbieten

Studie zeigt auf: Die Nutzung von KI lässt uns kognitive Fähigkeiten überschätzen

Adobe Firefly Image 5 mit erheblichen Updates: Native Generierung von 4 Millionen Pixeln, KI-Audiospuren + benutzerdefinierte Modelle — Kreative betreten die Ära der vollständigen AI-Kreation

Empfohlene verwandte KI-Nachrichten

20.000 Dollar für einen Haushaltsroboter? OpenAI-gefundene 1X Neo humanoiden Roboter startet Vorbestellungen, kommt 2024 in amerikanische Häuser

AWS plant eine zusätzliche Investition von 5 Milliarden Dollar in Südkorea, um den Aufbau von KI-Datenzentren voranzutreiben

Der Vater von DayZ vergleicht die aktuelle Angst vor KI mit der früheren Panik vor Google und Wikipedia

Ding Xiang Vice-Präsident Li Liang sagte, dass KI die Verbreitung von Gerüchten einfacher macht, und die Plattform verwendet gerade intelligente Systeme zur Bekämpfung von Gerüchten

SoulX-Podcast-Modell der Soul-Sprachtechnologie: Schockierende Veröffentlichung des 90-minütigen ununterbrochenen Podcasts - AI-Sprachrevolution wird erneut verbessert

Google stellt AI-Marketing-Tool Pomelli vor: Automatisches Erstellen von Markeninhalten mit nur einer Webadresse

Google präsentiert den KI-automatisierten Marketing-Tool Pomelli, mit dem Marketinginhalte durch Eingabe einer Webseiten-URL generiert werden können

US-Senatoren schlagen vor, das Nutzen von KI-Chatbot durch Minderjährige zu verbieten

Studie zeigt auf: Die Nutzung von KI lässt uns kognitive Fähigkeiten überschätzen

Adobe Firefly Image 5 mit erheblichen Updates: Native Generierung von 4 Millionen Pixeln, KI-Audiospuren + benutzerdefinierte Modelle — Kreative betreten die Ära der vollständigen AI-Kreation

GEO Services