Kürzlich hat die „Wiederbelebung“ von Fotos mithilfe von KI im Internet für Aufsehen gesorgt, und Heygen hat sich nun auch mit einem Lippensynchronisations-Tool in den Markt begeben.
Sie müssen lediglich ein Foto und eine Audiodatei hochladen, und die Person auf dem Foto kann dann den Audioinhalt sprechen, singen oder sogar vorlesen. Derzeit werden Audiodateien mit einer Länge von bis zu 20 Sekunden unterstützt, d. h., Sie können ein 20-sekündiges Video erstellen. Noch beeindruckender ist, dass das Tool die Hauptstimme erkennt und sicherstellt, dass Lippenbewegungen und Gesichtsausdrücke perfekt mit dem Audio synchronisiert sind.
Es gibt jedoch einen kleinen Wermutstropfen: Heygen scheint für Nutzer aus dem chinesischen Raum eine Hürde eingerichtet zu haben. Derzeit können Nutzer aus China sich weder anmelden noch ein neues Konto erstellen. Dies könnte viele Interessierte enttäuschen.
Davon abgesehen ist die Entwicklung von Heygen jedoch sehr vielversprechend. Im Juni dieses Jahres hat Heygen in einer Finanzierungsrunde 60 Millionen US-Dollar mit einer Bewertung von 500 Millionen US-Dollar eingesammelt. Die Finanzierungsrunde wurde von Benchmark angeführt, unterstützt von bekannten Investoren wie Conviction, Thrive Capital und Bond Capital. Im Rahmen der Transaktion wird Victor Lazarte, Partner bei Benchmark, dem Verwaltungsrat von Heygen beitreten.
Bisher hat Heygen insgesamt 74 Millionen US-Dollar eingesammelt. Das 2020 gegründete Startup-Unternehmen ist eines von vielen, die generative KI-Technologie nutzen, um Videos kostengünstiger und einfacher zu produzieren. Mit dem Tool von Heygen kann jeder realistische Avatare erstellen, mit seiner eigenen Stimme sprechen und sogar in mehrere Sprachen übersetzen.
Testversion: https://labs.heygen.com/guest/expressive-photo-avatar