Information

Latest AI News

Explore AI Frontiers, Master Industry Trends

AI Daily Brief

Your Daily AI Brief - Never Miss What's Next

Information

AI Product Finder

Smart Product Discovery - Comprehensive Market Intelligence

AI Product Rankings

AI Product Power Rankings - Performance, Buzz & Trends

AI Product Submit

Submit Your AI Product - Amplify Reach & Drive Growth

Tools

AI Tools Directory

Discover The Best AI Websites & Tools

Information

AI Models Finder

Comprehensive AI Models Collection for All Your Development & Research Needs

LLM Leaderboard

AI LLM Power Rankings - Performance, Buzz & Trends

Model Providers

Discover Trusted AI Model Partners - Guaranteed Reliable Support

Submit Your Model

Submit Your Model Info & Services - Precision Marketing & User Targeting

Tools

Compare LLMs

Multi-Dimensional Large Model Comparison - Find Your Perfect Match

LLM Cost Calculator

Calculate AI Model Costs Accurately - Optimize Your Budget

LLM Arena

Multi-Model Real-Time Evaluation & Quick Output Comparison

Information

MCP Servers

Discover Popular AI-MCP Services - Find Your Perfect Match Instantly

MCP Client

Easy MCP Client Integration - Access Powerful AI Capabilities

MCP Case Tutorials

Master MCP Usage - From Beginner to Expert

MCP Ranking

Top MCP Service Performance Rankings - Find Your Best Choice

MCP Service Submission

Publish & Promote Your MCP Services

Tools

MCP Playground

Test MCP Services Freely - Quick Online Experience

MCP Inspector

Quick MCP Service Testing - Fast Deployment

GEO Services

Achieve Dominant Visibility in AI Search for Your Business or Brand with GEO Services

AI Search Visibility Checker

Detect brand's visibility on AI platforms

Tools

AI Model Compatibility Checker

Free PC Hardware Test for DeepSeek & Llama

Information

AI Dataset Collection

Large-scale datasets and benchmarks for training, evaluating, and testing models to measure

Tools

Intelligent Document Recognition

Comprehensive Text Extraction and Document Processing Solutions for Users

AI Tutorial

Neues Bewegungsgenerationsmodell Wan2.2-Animate von Tongyi Wanxiang wird offiziell open source

AIbase基地

Veröffentlicht amKI-Nachrichten und -Informationen · 3 Minuten Lesezeit · Sep 19, 2025

Am 19. September 2025 kündigte Alibaba Cloud die neue Bewegungsgenerationsmodell Wan2.2-Animate aus der Reihe Tongyi Wanxiang offiziell als Open Source an. Das Modell kann Personen, Anime-Charaktere und Tierfotos steuern und wird in Bereichen wie Kurzvideoerstellung, Tänzermustergenerierung und Anime-Produktion weit verbreitet eingesetzt. Nutzer können das Modell und den Code auf GitHub, HuggingFace und der Moba-Community herunterladen oder die API über die Plattform Alibaba Cloud BaiLian aufrufen oder direkt auf der offiziellen Website von Tongyi Wanxiang testen.

Das Wan2.2-Animate-Modell ist das Ergebnis einer umfassenden Weiterentwicklung des zuvor öffentlich zugänglichen Animate Anyone-Modells. Es bietet deutlich verbesserte Leistungen bei der Konsistenz der Personen und der Generierungsqualität und unterstützt zwei Modi: Bewegungsmuster und Rollenspiel. Im Rollenspielmodus können Sie ein Bild des Charakters und ein Referenzvideo eingeben, und das Modell überträgt die Bewegungen und Ausdrücke des Videocharakters auf den Bildcharakter, wodurch der Bildcharakter dynamische Darstellungsfähigkeit erhält. Im Mustermodus kann das Modell im Rahmen des Originalvideos die Bewegungen, Ausdrücke und Umgebung beibehalten und den Charakter im Video durch den Charakter im Bild ersetzen.

Das Team von Tongyi Wanxiang hat eine große Datenbank für Personenvideos erstellt, die Sprechen, Gesichtsausdrücke und Körperbewegungen umfasst, und hat danach eine Nachtrainierung mit dem Tongyi Wanxiang-Bild-zu-Videomodell durchgeführt. Das Wan2.2-Animate-Modell vereinheitlicht die Rolleinformationen, Umgebungsdaten und Bewegungen in einem einheitlichen Format und ermöglicht damit eine einheitliche Modellkompatibilität für beide Inferenzmodi. Für die Körpersprache und Gesichtsausdrücke verwendet das Modell jeweils Knochensignale und implizite Merkmale und kombiniert sie mit einem Modul zur Bewegungsweiterleitung, um präzise Nachbildungen von Bewegungen und Ausdrücken zu erreichen. In der Ersetzungsmodus hat das Team zudem einen separaten Lichtfusion-LoRA entworfen, um eine perfekte Lichtfusion zu gewährleisten.

Testergebnisse zeigen, dass das Wan2.2-Animate in Schlüsselindikatoren wie Videogenerationsqualität, Hauptkonsistenz und Wahrnehmungsverlust die Open-Source-Modelle StableAnimator und LivePortrait übertrifft und somit das leistungsfähigste Bewegungsmodell ist. Bei menschlichen subjektiven Bewertungen übertraf das Wan2.2-Animate sogar geschlossene Modelle wie Runway Act-two.

GitHub:https://github.com/Wan-Video/Wan2.2
Moba-Community:https://modelscope.cn/models/Wan-AI/Wan2.2-Animate-14B
HuggingFace:https://huggingface.co/Wan-AI/Wan2.2-Animate-14B

Tongyi Wanxiang Wan2.2-Animate AI-Neologismen Alibaba Cloud

Dieser Artikel stammt aus dem AIbase-Tagesbericht

Willkommen im Bereich [KI-Tagesbericht]! Hier ist Ihr Leitfaden, um jeden Tag die Welt der künstlichen Intelligenz zu erkunden. Jeden Tag präsentieren wir Ihnen die Hotspots im KI-Bereich, konzentrieren uns auf Entwickler und helfen Ihnen, technologische Trends zu erkennen und innovative KI-Produktanwendungen zu verstehen.

—— Erstellt von der AIbase-Tagesberichtgruppe

Empfohlene verwandte KI-Nachrichten

Google wirft den großen Trumpf: Gemini CLI mit einem Klick in MCP integriert, Entwickler befreit sich von der Konfigurations-Hölle

Der von Google geöffnete Werkzeug Gemini CLI ist tief mit dem FastMCP-Framework integriert und ermöglicht durch einen einzigen Befehl die Installation und Konfiguration eines MCP-Servers. Dies vereinfacht erheblich den traditionellen, mühsamen Entwicklungsprozess, bei dem manuell Umgebungen eingerichtet, Abhängigkeiten behandelt und Übertragungskanäle getestet werden mussten.

Oct 4, 2025

Der AI-Entwurfsstuhl von Sequoia Capital ist eingestürzt! Er wurde von Perplexity übernommen und nach 90 Tagen geschlossen

Visual Electric von Perplexity übernommen, Produkt wird in 90 Tagen eingestellt. Team wechselt zur neuen 'Agent Experience'-Abteilung. Preis unklar.....

Oct 4, 2025

Wie Entwickler die lokalen KI-Modelle von Apple in iOS 26 verwenden können

Apple führt in iOS 26 das Foundation Models Framework ein, das Entwicklern ermöglicht, große KI-Modelle lokal und kostenlos zu nutzen. Dies führt zu schnellen Innovationen in Apps wie 'Lil Artist', die mit 'AI-Geschichten' personalisierte Erlebnisse bieten.....

Oct 4, 2025

Beta-Version von Google Gemini 3.0 Pro entdeckt: Großer Fortschritt bei der Programmierfähigkeit, wird nächste Woche veröffentlicht

Google Gemini 3.0 Pro wird bald veröffentlicht, die Beta-Version zeigt, dass es in Bezug auf Programmierung hervorragend ist. Das Modell umfasst zwei Versionen: Pro und Flash. Entwickler haben Tests durchgeführt und die Ergebnisse erregten Aufmerksamkeit. Es folgt direkt auf OpenAI Sora 2 und steigert die Aufmerksamkeit im AI-Wettbewerb.

Oct 4, 2025

Micky Maus wird abgezogen! Character.AI erhält rechtliche Mahnung von Disney – Alle Disney-Charaktere werden entfernt

Disney fordert Character.AI zur Löschung von Mickey Mouse auf, da Urheberrechte verletzt wurden. Die Charaktere wurden innerhalb von 24 Stunden entfernt.....

Oct 3, 2025

Freier AI-Browser ist da! Perplexity senkt Comet, das 200 Dollar pro Monat kostet, auf alle Nutzer. Ein AI-Sekretär, der beim Surfen E-Mails schreibt, Tickets bucht und Preise vergleicht, ist jetzt verfügbar

Perplexitys kostenloser KI-Browser Comet mit seitlicher Assistenzleiste ermöglicht effizientes Multitasking wie Flugpreisvergleiche und E-Mail-Beantwortung ohne Tab-Wechsel. Nach Freigabe für alle führte hohe Nachfrage zu Serverproblemen.....

Oct 3, 2025

Kuaishou Colly 2.5Turbo-Modell dominiert weltweit die Videogenerierung!

Kuais Keling 2.5 Turbo führt im KI-Videogenerierung mit Bestwerten (1329/1252) im Artificial Analysis Benchmark und übertrifft Veo3.....

Oct 3, 2025

Neuer Stern im AI-Cloud-Services-CoreWeave erhält riesige Bestellungen von Meta und OpenAI, insgesamt 20,7 Milliarden Dollar!

CoreWeave sichert 20,7 Mrd. USD Verträge mit OpenAI und Meta bis 2031. Erfolg durch Partnerschaft mit Nvidia.....

Oct 3, 2025

Anthropic begrüßt einen neuen CTO: Der Fokus liegt auf der Stärkung der Präsenz im Bereich AI-Infrastruktur

Anthropic ernennt Rahul Patil als neuen CTO, ehemaliger Stripe-CTO. Gründer McCandlish wird Chief Architect. Teamstruktur angepasst für bessere KI-Infrastruktur.....

Oct 3, 2025

OpenAI-Bewertung steigt auf 500 Milliarden US-Dollar und wird zum weltgrößten Unicorn

OpenAI erreicht mit 500 Mrd. USD Bewertung einen Mitarbeiteraktienverkauf und überholt SpaceX als wertvollstes Startup. Verkauf von 6,6 Mrd. USD Aktien an Thrive Capital und SoftBank zeigt starke Marktanerkennung.....

Oct 3, 2025

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Submit Your Model

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

GEO Services​

AI Search Visibility Checker

AI Model Compatibility Checker

AI Dataset Collection

Intelligent Document Recognition

Neues Bewegungsgenerationsmodell Wan2.2-Animate von Tongyi Wanxiang wird offiziell open source

AIbase基地

Dieser Artikel stammt aus dem AIbase-Tagesbericht

Empfohlene verwandte KI-Nachrichten

Google wirft den großen Trumpf: Gemini CLI mit einem Klick in MCP integriert, Entwickler befreit sich von der Konfigurations-Hölle

Der AI-Entwurfsstuhl von Sequoia Capital ist eingestürzt! Er wurde von Perplexity übernommen und nach 90 Tagen geschlossen

Wie Entwickler die lokalen KI-Modelle von Apple in iOS 26 verwenden können

Beta-Version von Google Gemini 3.0 Pro entdeckt: Großer Fortschritt bei der Programmierfähigkeit, wird nächste Woche veröffentlicht

Micky Maus wird abgezogen! Character.AI erhält rechtliche Mahnung von Disney – Alle Disney-Charaktere werden entfernt

Freier AI-Browser ist da! Perplexity senkt Comet, das 200 Dollar pro Monat kostet, auf alle Nutzer. Ein AI-Sekretär, der beim Surfen E-Mails schreibt, Tickets bucht und Preise vergleicht, ist jetzt verfügbar

Kuaishou Colly 2.5Turbo-Modell dominiert weltweit die Videogenerierung!

Neuer Stern im AI-Cloud-Services-CoreWeave erhält riesige Bestellungen von Meta und OpenAI, insgesamt 20,7 Milliarden Dollar!

Anthropic begrüßt einen neuen CTO: Der Fokus liegt auf der Stärkung der Präsenz im Bereich AI-Infrastruktur

OpenAI-Bewertung steigt auf 500 Milliarden US-Dollar und wird zum weltgrößten Unicorn

GEO Services