Zhejiang-Universität und Alibaba lancieren OmniAvatar: ein körperbetriebenes digitales Menschmodell mit Audio-Antrieb erscheint beeindruckend

AIbase基地

Veröffentlicht amKI-Nachrichten und -Informationen · 3 Minuten Lesezeit · Jul 2, 2025

Die Zhejiang-Universität und Alibaba haben gemeinsam ein neues audiogetriebenes Modell namens OmniAvatar entwickelt, das eine neue Höhe in der Digitalpersonentechnologie markiert. Das Modell wird durch Audio angetrieben und kann natürliche, flüssige Videos von ganzen digitalen Personen generieren, wobei es besonders bei Gesangsszenarien hervorragende Ergebnisse erzielt. Die Lippenbewegungen sind präzise synchronisiert mit dem Audio, was ein sehr realistisches Ergebnis liefert.

OmniAvatar ermöglicht eine präzise Steuerung der Generierungsdetails über Textanweisungen. Benutzer können die Bewegungsamplitude der Person, die Hintergrundumgebung und die Emotionen selbst anpassen und zeigen so eine hohe Flexibilität. Darüber hinaus kann das Modell Videos erstellen, in denen virtuelle Personen mit Objekten interagieren, was für kommerzielle Szenarien wie E-Commerce-Werbung und Marketingwerbung großes Anwendungspotenzial bietet. Zum Beispiel können Marken OmniAvatar nutzen, um dynamische Werbevideos zu erstellen und die Interaktionserfahrung der Verbraucher zu verbessern.

Als Open-Source-Projekt wurde OmniAvatar auf GitHub veröffentlicht und hat weltweit Aufmerksamkeit von Entwicklern gewonnen. Seine außergewöhnlichen Leistungen in Bezug auf Gesichtsausdrücke, Halb- und Vollkörperanimationen übertreffen bestehende ähnliche Modelle. Es wird berichtet, dass das Modell auch für mehrere Szenarien geeignet ist, darunter Podcasts, menschliche Interaktionen und dynamische Darbietungen, und zeigt damit großes Potenzial im Bereich der Inhaltserschaffung.

Branchenexperten betonen, dass die Veröffentlichung von OmniAvatar nicht nur die Realitätsnähe und Kontrollierbarkeit der audiogetriebenen Digitalpersonentechnologie verbessert hat, sondern auch die Innovation in Bereichen wie Marketing, Bildung und Unterhaltung vorangetrieben hat. In Zukunft werden die Zhejiang-Universität und Alibaba ihre Zusammenarbeit vertiefen und weitere Möglichkeiten des multimodalen KI erforschen.

OmniAvatar Zhejiang-Universität Alibaba Digitale Menschen-Technologie

Dieser Artikel stammt aus dem AIbase-Tagesbericht

Willkommen im Bereich [KI-Tagesbericht]! Hier ist Ihr Leitfaden, um jeden Tag die Welt der künstlichen Intelligenz zu erkunden. Jeden Tag präsentieren wir Ihnen die Hotspots im KI-Bereich, konzentrieren uns auf Entwickler und helfen Ihnen, technologische Trends zu erkennen und innovative KI-Produktanwendungen zu verstehen.

—— Erstellt von der AIbase-Tagesberichtgruppe

Empfohlene verwandte KI-Nachrichten

Neue Meilensteine der Modul-Technologie: Millionenfinanzierung und neue Ära für multimodale Tastsensor-Systeme

Jul 8, 2025

Der Super-Menschen-Interaktions-API von iFlytek ist offiziell auf der iFlytek Open Platform gestartet

Im August 2024 hat iFlytek die Super-Menschen-Interaktions-Technologie 'Xinghuo Speed' offiziell eingeführt. Durch end-to-end Sprachmodellierung und mehrdimensionale Emotions-Entkoppelungstraining wird die Reaktionsgeschwindigkeit, emotionaler Resonanz und kontrollierbare Sprachexpression in drei Kernbereichen überwunden. Diese Technologie kann Emotionswellen in der Sprache der Benutzer präzise erkennen und passende Tonfallreaktionen in Echtzeit liefern. Zudem unterstützt sie dynamische Anpassungen der Sprechgeschwindigkeit, Tonlage und Charakterdarstellung. Dies markiert einen übergreifenden Fortschritt der Sprachinteraktion von 'Funktionalität' zur 'emotionalen Verbindung'. Der Super-Menschen-Interaktions-API ist derzeit offiziell auf der iFlytek Open Platform gestartet, und Entwickler können diese Technologie kosteneffizient nutzen.

Jul 8, 2025

Feidu Technologie präsentiert den Yuzhang-Modell, das digitale Zwillinge betreten ein neues Zeitalter der Intelligenz!

Feidu Tech präsentiert 'Zhengmo-Modell', führend in Präzision und Semantik. Wichtig für Katastrophensimulation und Kulturerhalt. Demo und API verfügbar, fördert intelligente Entwicklung.....

Jul 7, 2025

Yushu Technology macht sich für den IPO auf der Sci-Tech Innovation Board bereit, mit einer Bewertung von 10 Milliarden Yuan und starken Investitionen von Alibaba und Tencent

宇树科技 schließt C-Runde mit 700 Mio. CNY ab, Bewertung jetzt 12 Mrd. CNY. IPO vorbereitet, unterstützt von China Mobile, Tencent und Alibaba.....

Jul 7, 2025

Kreativer Leiter von Pixar: KI-Technologie ist immer noch enttäuschend, Animationserstellung ist unverzichtbar

Pixars Pete Docter kritisiert aktuelle KI als "langweilig", betont aber ihre Rolle als Hilfsmittel. Diskussionen über KIs Einfluss auf die Filmindustrie bleiben kontrovers.....

Jul 7, 2025

E Ink stellt AI-Touchpad vor: E-Paper-Technologie könnte die Interaktion mit Notebooks verändern

Das Unternehmen E Ink kündigte kürzlich an, ein neues Touchpad für Notebooks entwickelt zu haben, das die gleiche E-Paper-Technologie verwendet wie E-Reader. Dieses innovative Produkt soll nicht einfach nur die Größe des Touchpads vergrößern oder zusätzliche Display-Funktionen hinzufügen, sondern vielmehr als spezielle Plattform für KI-Anwendungen und Assistenten dienen und parallel zu den gängigen Betriebssystemen laufen. In einer Prototypenbild, das von E Ink veröffentlicht wurde, wird das verbesserte Touchpad gezeigt, das einen farbigen E-Paper-Bildschirm besitzt, ähnlich dem Kindle Colorsoft von Amazon.

Jul 4, 2025

CoreWeave stellt erstmals die neueste NVIDIA AI-Chip-Technologie vor und unterstützt die Innovation in der Cloud-Computing-Industrie

Kürzlich verkündeten NVIDIA und CoreWeave, dass der neueste künstliche-intelligenz-Grafikprozessor von NVIDIA, der Blackwell Ultra-Chip, nun kommerziell bei CoreWeave eingesetzt wird. Diese Nachricht gibt zweifellos neuen Schwung für cloud-basierte AI-Dienste. Dell gab ebenfalls bekannt, dass CoreWeave personalisierte Geräte auf der Basis des NVIDIA GB300NVL72AI-Systems erhalten hat, was bedeutet, dass CoreWeave zum ersten Mal Systeme auf der Basis von Blackwe

Jul 4, 2025

Kyutai Labs open-sourct Kyutai TTS: Technologie der Niedrigverzögerung für streamenden Text-zu-Sprache

Am 3. Juli gab das französische KI-Forschungsinstitut Kyutai Labs bekannt, seine neueste Text-zu-Sprache-(TTS)-Technologie - Kyutai TTS - zu open-sourcen und Entwicklern und KI-Begeisterten eine effiziente und reale Sprachgenerierungslösung anzubieten. Kyutai TTS zeichnet sich durch niedrige Verzögerung und hochwertigen Klang aus und unterstützt den streamenden Texttransport, wodurch die Audiodatei bereits mit Teiltexten beginnen kann. Dies ist besonders für Echtzeit-Interaktionszenarien geeignet. Kyutai TTS hat herausragende Leistungen gezeigt. Bei der Nutzung einer einzelnen NVIDIA L40S-GPU

Jul 4, 2025

Tageszeitung AI: Baidu veröffentlicht die Plattform HuiXiang und MuseSteamer; Alibaba präsentiert das audiogetriebene gesamtkörperelektronische Modell OmniAvatar

Willkommen bei der Serie „AI-Tageszeitung“! Hier ist Ihr täglicher Leitfaden für die Welt der Künstlichen Intelligenz. Jeden Tag präsentieren wir Ihnen die aktuellen Themen aus dem Bereich KI, mit Fokus auf Entwickler, um Ihnen dabei zu helfen, technologische Trends zu erkennen und innovative Anwendungen von KI-Produkten kennenzulernen. Klicken Sie hier, um frische KI-Produkte zu entdecken: https://top.aibase.com/1. Open Source-End-to-End-Sprachgroßmodell Step-Audio-AQAA: Verstehen Sie Audio und generieren Sie natürliche Sprache direkt. Step-Audio-AQAA ist ein Open-Source-End-to-End-Sprachgroßmodell,

Jul 2, 2025

Die Frühlingstage für AI-Unternehmer sind gekommen! Mit führenden Persönlichkeiten der Branche über Finanzierungstipps diskutieren

Im Strom der technologischen Innovation verändern AI-Startups die Branchenlandschaft, doch die Herausforderungen bei der Finanzierung bleiben bestehen. Um frühen AI-Startups dabei zu helfen, sich von traditionellen Finanzierungsgedanken zu befreien, wird der bekannte Venture-Capitalist Kleida Martiro bei der TechCrunch All Stage-Veranstaltung am 15. Juli in Boston eine Diskussionsrunde mit dem Thema „Gewinnen Sie Kapital im wettbewerbsintensiven Markt: Wie man für Ihr AI-Startup finanziert“ leiten.

Jul 2, 2025

Product Finder

Product Submit

AI Models Finder

MCP Servers

MCP Client

MCP Inspector

Case Tutorials

Latest AI News

AI Daily Brief

Zhejiang-Universität und Alibaba lancieren OmniAvatar: ein körperbetriebenes digitales Menschmodell mit Audio-Antrieb erscheint beeindruckend

AIbase基地

Dieser Artikel stammt aus dem AIbase-Tagesbericht

Empfohlene verwandte KI-Nachrichten

Neue Meilensteine der Modul-Technologie: Millionenfinanzierung und neue Ära für multimodale Tastsensor-Systeme

Der Super-Menschen-Interaktions-API von iFlytek ist offiziell auf der iFlytek Open Platform gestartet

Feidu Technologie präsentiert den Yuzhang-Modell, das digitale Zwillinge betreten ein neues Zeitalter der Intelligenz!

Yushu Technology macht sich für den IPO auf der Sci-Tech Innovation Board bereit, mit einer Bewertung von 10 Milliarden Yuan und starken Investitionen von Alibaba und Tencent

Kreativer Leiter von Pixar: KI-Technologie ist immer noch enttäuschend, Animationserstellung ist unverzichtbar

E Ink stellt AI-Touchpad vor: E-Paper-Technologie könnte die Interaktion mit Notebooks verändern

CoreWeave stellt erstmals die neueste NVIDIA AI-Chip-Technologie vor und unterstützt die Innovation in der Cloud-Computing-Industrie

Kyutai Labs open-sourct Kyutai TTS: Technologie der Niedrigverzögerung für streamenden Text-zu-Sprache

Tageszeitung AI: Baidu veröffentlicht die Plattform HuiXiang und MuseSteamer; Alibaba präsentiert das audiogetriebene gesamtkörperelektronische Modell OmniAvatar

Die Frühlingstage für AI-Unternehmer sind gekommen! Mit führenden Persönlichkeiten der Branche über Finanzierungstipps diskutieren