Kürzlich hat Hedra Labs eine Vorschauversion von Character-1 veröffentlicht, einer Technologie, die es Nutzern ermöglicht, dynamische Videos von Personen zu erstellen, die sprechen und singen, basierend auf Fotos und Sprachdaten.
Stellen Sie sich vor: Sie laden ein Foto einer Person hoch und fügen beliebige Sprachaufnahmen hinzu. Im Handumdrehen wird ein dynamisches Video generiert, das dem Foto Leben einhaucht. Die Person im Bild spricht oder singt, wobei Lippenbewegungen, Gesichtsausdrücke und Körperhaltung perfekt auf die Sprachaufnahme abgestimmt sind! Klingt aufregend, nicht wahr?
Offizielles Demo-Video von Hedra Labs
Hauptmerkmale und Highlights:
Plattformübergreifende Kompatibilität: Character-1 kann sowohl auf Desktop-Computern als auch auf mobilen Geräten problemlos verwendet werden.
Generierung unbegrenzter Länge: Die aktuell verfügbare Vorschauversion unterstützt die Generierung von 30 Sekunden langen Videos. Bei ausreichender Verfügbarkeit von H100-Chips können pro 60 Sekunden 90 Sekunden Inhalt generiert werden.
Unterstützung verschiedener Ausdrucksformen: Character-1 unterstützt nicht nur Dialoge, sondern auch Gesang und Rap.
Hedra bietet eine benutzerfreundliche Oberfläche, die auch für Nicht-Profis einfach zu bedienen ist. Nutzer können die Hedra-Website besuchen, Text-to-Speech-Funktionen nutzen oder Audiodateien direkt hochladen, eine Charakterbeschreibung eingeben und dann ein dynamisches Video generieren.
Die KI-Technologie von Hedra sorgt für hohe Qualität und Realismus der Videodaten. Gesichtsausdrücke, Körperhaltung und die Synchronität der Sprache erreichen überzeugende Ergebnisse.
Wie die offiziellen Beispiele zeigen, kann Character-1 Gesang, Schauspiel und die Darstellung verschiedener Emotionen perfekt wiedergeben. Die Technologie ist nicht auf menschliche Charaktere beschränkt, sondern kann auch lebensechte, nicht-lebende Objekte darstellen, sofern diese über deutlich erkennbare Gesichtsmerkmale verfügen.
Die Anwendung ist sehr einfach. Die Schritte sind wie folgt:
Öffnen Sie die Hedra-Testseite: https://top.aibase.com/tool/hedra
Auf der Seite sehen Sie die Benutzeroberfläche.
Die Benutzeroberfläche ist einfach. Geben Sie im ersten Feld Ihren Dialog ein und wählen Sie eine Stimme. Sie können natürlich auch Ihre eigene Audiodatei importieren, wenn Sie keine generierte Audiodatei verwenden möchten.
Hier gebe ich einfach den Satz „Hallo, dies ist ein von AIBase erstelltes Sprechvideo. Heute zeigen wir Ihnen Hedra und wie einfach die Videogenerierung sein kann“ ein.
Laden Sie dann im zweiten Feld das Bild der Person hoch, die sprechen soll. Hier lade ich ein zuvor erstelltes Foto eines weiblichen Models hoch.
Wer kein passendes Bild hat, kann im unteren Textfeld seine Figur beschreiben und auf „Erstellen“ klicken, um sie zu generieren.
Nach dem Hochladen des Bildes klicken Sie im dritten Feld unten auf „Video generieren“.
Hier ist das Ergebnis:
Das von Hedra generierte Sprechvideo wirkt recht dynamisch. Nicht nur der Mund bewegt sich, sondern auch andere Körperteile, und es gibt auch Gesichtsausdrücke. Allerdings ist die Auswahl an Stimmen auf der Plattform begrenzt, der Akzent der ausländischen Stimme passt nicht so gut zu meinem Bild, und die Qualität des generierten Videos ist etwas schlechter als das Originalbild. Ich hoffe, die Plattform wird die Bildqualität in Zukunft verbessern.
Hier lade ich eine eigene Audiodatei hoch, die ich mit CapCut erstellt habe. Ich habe eine weibliche Stimme ausgewählt und den Text direkt eingeben lassen.
Noch ein Test:
Audio importieren
Das Ergebnis:
Das Problem mit der Unschärfe kann mit der Videoverbesserungsfunktion von Krea AI behoben werden. Beachten Sie jedoch, dass die kostenlose Testversion nur Videos mit einer Länge von maximal 10 Sekunden unterstützt. Längere Videos müssen selbst zugeschnitten werden. Wählen Sie außerdem keine zu hohe Framerate. Ich habe 60 fps gewählt und musste dann für die Bearbeitung bezahlen – sehr ärgerlich!