NVIDIA open-sourcet Audio2Face-Modell, KI unterstützt die Echtzeit-Gesichtsanimation

AIbase基地

Veröffentlicht amKI-Nachrichten und -Informationen · 4 Minuten Lesezeit · Sep 25, 2025

Kürzlich kündigte NVIDIA die Open-Source-Veröffentlichung seines generativen KI-Gesichtsanimationsmodells Audio2Face an. Dieses Modell enthält nicht nur den Kernalgorithmus, sondern auch ein Softwareentwicklungspaket (SDK) und einen vollständigen Trainingsrahmen, um die Entwicklung intelligenter virtueller Charaktere in Spielen und 3D-Anwendungen zu beschleunigen.

Audio2Face analysiert akustische Merkmale wie Lautzeichen und Betonung in Audiodateien und kann so in Echtzeit die Gesichtsbewegungen virtueller Charaktere steuern, um präzise Lippenbewegungen und natürliche Emotionen zu erzeugen. Diese Technologie wird in verschiedenen Bereichen wie Spielentwicklung, Filmproduktion und Kundendienst weit verbreitet eingesetzt.

Das Audio2Face-Modell unterstützt zwei Ausführungsmodi: eines für die Offline-Rendering von vorab aufgenommenen Audios und eines für die Echtzeit-Streaming-Verarbeitung dynamischer KI-Charaktere. Um Entwicklern die Nutzung zu erleichtern, hat NVIDIA auch mehrere Schlüsselkomponenten geöffnet, darunter das Audio2Face SDK, ein lokales Add-on für Autodesk Maya und ein Add-on für Unreal Engine 5.5 und höher. Darüber hinaus wurden auch die Regressionsmodelle und Diffusionsmodelle geöffnet, sodass Entwickler mit dem offenen Trainingsrahmen eigene Daten verwenden können, um das Modell an spezifische Anwendungsfälle anzupassen.

Momentan wird diese Technologie bereits von zahlreichen Spielentwicklern weit verbreitet genutzt. Das Spielentwicklungsunternehmen Survios integrierte Audio2Face in sein Spiel „Alien: Dead Space Evolution“, wodurch der Prozess der Lippenbewegungssynchronisation und der Gesichtserfassung stark vereinfacht wurde. Das Studio Farm51 setzte diese Technologie ebenfalls in seinem Werk „Chernobyl: Zone of Exclusion 2“ ein und generierte durch Audio detaillierte Gesichtsanimationen, was viel Produktionsszeit sparte und die Realitätsnähe und Immersion der Charaktere verbesserte. Der Innovationsdirektor des Studios, Wojciech Pazdur, bezeichnete diese Technologie als „revolutionäre Fortschritte“.

Die neue Initiative von NVIDIA bietet Entwicklern zweifellos mehr kreative Werkzeuge und wird die Weiterentwicklung der Darstellung virtueller Charaktere vorantreiben. Mit der stetigen technologischen Entwicklung können wir uns auf realistischere und lebendigere Charakterdarstellungen in zukünftigen Spielen und Filmen freuen.

Eingang: https://build.nvidia.com/nvidia/audio2face-3d

Zusammenfassung:
🔊 NVIDIA öffnet die Quellen des Audio2Face-Modells, um die Technik der Gesichtsanimation von virtuellen Charakteren zu verbessern.
🎮 Unterstützt Offline-Rendering und Echtzeit-Streaming-Verarbeitung und ist für verschiedene Szenarien geeignet.
🌟 Wird von mehreren Spielentwicklern genutzt, vereinfacht den Produktionsprozess und erhöht die Realitätsnähe der Charaktere.

Qualcomm dringt in den Datenbank-Markt ein! Einführung der AI200/AI250-Chips mit Ziel Nvidia, Aktienkurs steigt um 20% an einem Tag

Qualcomm hat zwei Cloud-AI-Inferring-Chips, AI200 und AI250, vorgestellt und plant deren kommerzielle Nutzung im Jahr 2026 bzw. 2027. Dies markiert den Übergang von Endgeräte-Chips zu einer vollständigen AI-Infrastruktur. Die Nachricht führte zu einem Anstieg des Aktienkurses um mehr als 20% an einem Tag und ist der größte Anstieg seit 2019. Im Gegensatz zur allseitigen Strategie von Nvidia konzentriert sich Qualcomm auf den Markt für große Modell-Inferring und betont die Vorteile der Energieeffizienz und Kosten.

NVIDIA präsentiert eine revolutionäre AI-Rechenzentrum-Design, um leistungsstarke Berechnungen zu unterstützen

Bei der GTC-Messe 2025 stellte NVIDIA das Designkonzept 'Omniverse DSX Blueprint' für gigawattgroße AI-Rechenzentren vor und bezeichnete es als 'AI-Fabrik'. Dieses Konzept basiert auf dem Omniverse-Framework und unterstützt verschiedene Größen von 100 Millionen bis 1 Milliarde Watt. Es soll die effiziente Ausbildung und Ausführung großer KI-Modelle ermöglichen und den wachsenden Anforderungen an KI-Berechnungen gerecht werden. Es handelt sich um einen wichtigen Fortschritt in der Infrastruktur für künstliche Intelligenz.

Huang Renxun widerspricht der Theorie des AI-Blasen, NVIDIA's neue Chips werden voraussichtlich 500 Milliarden Dollar Umsatz erzielen

Der CEO von NVIDIA, Huang Renxun, lehnte die Theorie des AI-Markt-Blasen auf der GTC-Konferenz in Washington ab und erwartet, dass die neuen Blackwell- und Rubin-Chips in den nächsten Quartalen 500 Milliarden Dollar Umsatz erzeugen werden und damit eine neue Wachstumsphase für das Unternehmen einleiten. Dies ist die erste GTC-Konferenz, die NVIDIA in der US-Hauptstadt veranstaltet.

NVIDIA open-sourcet OmniVinci-Modell für multimodale Wahrnehmung, Trainingsdaten nur 1/6

NVIDIA veröffentlicht das multimodale Verständnismodell OmniVinci, das in verschiedenen Benchmarks um 19,05 Punkte besser abschneidet als führende Modelle. Das Modell verwendet nur 0,2 Billionen Trainings-Token und erreicht eine sechsmal höhere Daten-effizienz als Konkurrenten. Es soll die einheitliche Wahrnehmung von Bildern, Audio und Text ermöglichen und die multimedialen Fähigkeiten von Maschinen voranbringen.

NVIDIA präsentiert den multimodalen Verständnismodell OmniVinci und erreicht mit einem SOTA-Vorsprung von 19,05 Punkten

NVIDIA hat den multimodalen Verständnismodell OmniVinci veröffentlicht, der im Benchmark-Test 19,05 Punkte besser abschneidet als führende Modelle. Mit nur 1/6 der Trainingsdaten erreicht dieses Modell beeindruckende Leistungen. Das Modell ist darauf ausgelegt, AI-Systeme gleichzeitig visuelle, auditive und textuelle Informationen zu verarbeiten und das menschliche mehrsensorische Wahrnehmungssystem nachzuahmen.

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

GEO Brand Visibility

AI Brand Monitoring Tool

AI Search Visibility Checker

GEO Promotion Link Detection

GEO Ranking Optimization System

GEO Services​

AI Model Compatibility Checker

AI Deployment Calculator

NVIDIA open-sourcet Audio2Face-Modell, KI unterstützt die Echtzeit-Gesichtsanimation

AIbase基地

Dieser Artikel stammt aus dem AIbase-Tagesbericht

Empfohlene verwandte KI-Nachrichten

Qualcomm dringt in den Datenbank-Markt ein! Einführung der AI200/AI250-Chips mit Ziel Nvidia, Aktienkurs steigt um 20% an einem Tag

NVIDIA präsentiert eine revolutionäre AI-Rechenzentrum-Design, um leistungsstarke Berechnungen zu unterstützen

Huang Renxun widerspricht der Theorie des AI-Blasen, NVIDIA's neue Chips werden voraussichtlich 500 Milliarden Dollar Umsatz erzielen

​NVIDIA open-sourcet OmniVinci-Modell für multimodale Wahrnehmung, Trainingsdaten nur 1/6

NVIDIA präsentiert den multimodalen Verständnismodell OmniVinci und erreicht mit einem SOTA-Vorsprung von 19,05 Punkten

Qualcomm stellt neueste AI-Chips vor und stellt NVIDIA heraus, was zu einem Anstieg des Aktienkurses um 20 % führte

OpenAI und AMD schließen eine wichtige Zusammenarbeit ab und eröffnen eine neue Ära der KI

OpenAI betritt erneut den Bereich der Musikgenerierung: Neues Werkzeug kann Videos mit intelligenten Soundtracks versehen und arbeitet mit der Juilliard School an fortgeschrittenen KI-Kompositions-Fähigkeiten

Meta integriert AI-Bearbeitungsfunktionen direkt in Instagram Stories und erstellt mit einem Klick magische Effekte

KI-Video-Technologie in spezifischen Bereichen angekommen! Runway öffnet Zugriff auf Modell-Anpassungen, fokussiert sich auf Roboter und Bauwesen

Empfohlene verwandte KI-Nachrichten

Qualcomm dringt in den Datenbank-Markt ein! Einführung der AI200/AI250-Chips mit Ziel Nvidia, Aktienkurs steigt um 20% an einem Tag

NVIDIA präsentiert eine revolutionäre AI-Rechenzentrum-Design, um leistungsstarke Berechnungen zu unterstützen

Huang Renxun widerspricht der Theorie des AI-Blasen, NVIDIA's neue Chips werden voraussichtlich 500 Milliarden Dollar Umsatz erzielen

​NVIDIA open-sourcet OmniVinci-Modell für multimodale Wahrnehmung, Trainingsdaten nur 1/6

NVIDIA präsentiert den multimodalen Verständnismodell OmniVinci und erreicht mit einem SOTA-Vorsprung von 19,05 Punkten

Qualcomm stellt neueste AI-Chips vor und stellt NVIDIA heraus, was zu einem Anstieg des Aktienkurses um 20 % führte

OpenAI und AMD schließen eine wichtige Zusammenarbeit ab und eröffnen eine neue Ära der KI

OpenAI betritt erneut den Bereich der Musikgenerierung: Neues Werkzeug kann Videos mit intelligenten Soundtracks versehen und arbeitet mit der Juilliard School an fortgeschrittenen KI-Kompositions-Fähigkeiten

Meta integriert AI-Bearbeitungsfunktionen direkt in Instagram Stories und erstellt mit einem Klick magische Effekte

KI-Video-Technologie in spezifischen Bereichen angekommen! Runway öffnet Zugriff auf Modell-Anpassungen, fokussiert sich auf Roboter und Bauwesen

GEO Services

NVIDIA open-sourcet OmniVinci-Modell für multimodale Wahrnehmung, Trainingsdaten nur 1/6

NVIDIA open-sourcet OmniVinci-Modell für multimodale Wahrnehmung, Trainingsdaten nur 1/6