El modelo de generación de acciones Wan2.2-Animate de Tongyi Wanxiang se ha lanzado oficialmente como código abierto

AIbase基地

Publicado elNoticias de IA · 5 minutos de lectura · Sep 19, 2025

El 19 de septiembre de 2025, Alibaba Cloud anunció que el modelo de generación de acciones nuevo, Wan2.2-Animate, está ahora disponible como código abierto. Este modelo puede impulsar fotos de personas, personajes animados y animales, y se aplica ampliamente en la creación de videos cortos, generación de plantillas de baile y producción de animaciones. Los usuarios pueden descargar el modelo y el código en GitHub, HuggingFace y la comunidad Mota, o pueden llamar a la API a través de la plataforma Alibaba Cloud BaiLian o probar directamente en el sitio web de Tongyi Wanxiang.

El modelo Wan2.2-Animate es el resultado de una mejora integral del modelo anterior, Animate Anyone, con mejoras significativas en indicadores como la coherencia de las personas y la calidad de generación, al mismo tiempo que admite dos modos: imitación de acciones y representación de roles. En el modo de imitación de personajes, al introducir una imagen del personaje y un video de referencia, el modelo puede transferir las acciones y expresiones del personaje del video a la imagen, otorgando así dinamismo a la imagen. Mientras que en el modo de representación de personajes, el modelo puede reemplazar al personaje del video por el personaje de la imagen, manteniendo al mismo tiempo las acciones, expresiones y entorno del video original.

Captura de pantalla de WeChat_20250919144208.png

El equipo de Tongyi Wanxiang ha construido un conjunto de datos a gran escala de videos de personas que incluyen hablar, expresiones faciales y movimientos corporales, y lo ha entrenado posteriormente basándose en el modelo de generación de videos de imágenes de Tongyi Wanxiang. Wan2.2-Animate normaliza la información del personaje, la información del entorno y las acciones en un formato de representación uniforme, logrando así que un solo modelo sea compatible con dos modos de razonamiento. Para los movimientos corporales y las expresiones faciales, el modelo utiliza señales óseas e características implícitas respectivamente, junto con un módulo de redirección de acciones, para lograr una reproducción precisa de las acciones y expresiones. En el modo de reemplazo, el equipo también diseñó un LoRA independiente de fusión de iluminación, utilizado para garantizar un efecto perfecto de fusión de iluminación.

Los resultados de pruebas muestran que Wan2.2-Animate supera a modelos de código abierto como StableAnimator y LivePortrait en indicadores clave como la calidad de generación de videos, la coherencia del sujeto y la pérdida percibida, convirtiéndose en el modelo de generación de acciones con mejor rendimiento actual. En evaluaciones subjetivas humanas, Wan2.2-Animate incluso supera a modelos de código cerrado como Runway Act-two.

GitHub: https://github.com/Wan-Video/Wan2.2
Comunidad Mota: https://modelscope.cn/models/Wan-AI/Wan2.2-Animate-14B
HuggingFace: https://huggingface.co/Wan-AI/Wan2.2-Animate-14B

¡Google lanza una gran sorpresa! Gemini CLI conecta de un solo clic a MCP, los desarrolladores se libran del infierno de configuración

La herramienta de código abierto de Google, Gemini CLI, se integra profundamente con el marco FastMCP, permitiendo la instalación y configuración del servidor MCP con un solo comando, lo que reduce significativamente el complejo proceso de desarrollo tradicional que requiere configurar manualmente el entorno, manejar dependencias y depurar canales de transmisión.

El lanzamiento interno de Gemini 3.0 Pro de Google se filtra: un gran avance en habilidades de programación, se lanzará la próxima semana

Gemini 3.0 Pro de Google está a punto de ser lanzado; la versión de prueba interna muestra que sus habilidades en programación son excelentes. Este modelo incluye dos versiones: Pro y Flash. Los resultados de las pruebas realizadas por desarrolladores han llamado la atención, siguiendo a OpenAI Sora 2, lo que agrega más calor a la competencia en inteligencia artificial.

La nueva aplicación de OpenAI Sora alcanza el primer lugar en la tienda de aplicaciones de Apple en cuatro días

La aplicación de generación de videos nueva de OpenAI Sora se lanzó solo cuatro días y alcanzó el primer lugar en la lista gratuita de la tienda de aplicaciones de Apple, superando a Google Gemini y su propio ChatGPT. La aplicación permite a los usuarios generar, editar y compartir videos cortos. Actualmente está disponible solo para usuarios de iOS en Estados Unidos y Canadá mediante un sistema de invitación. La reacción del mercado muestra una fuerte demanda de herramientas de video de inteligencia artificial.

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Submit Your Model

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

GEO Services

AI Search Visibility Checker

AI Model Compatibility Checker

AI Dataset Collection

Intelligent Document Recognition

El modelo de generación de acciones Wan2.2-Animate de Tongyi Wanxiang se ha lanzado oficialmente como código abierto

AIbase基地

Este artículo proviene de AIbase Daily

Noticias de IA relacionadas recomendadas

¡Google lanza una gran sorpresa! Gemini CLI conecta de un solo clic a MCP, los desarrolladores se libran del infierno de configuración

La valoración de OpenAI alcanza los 500 mil millones de dólares ¡Los empleados venden 6.600 millones de dólares! El récord de una empresa privada

¡La herramienta de diseño de IA invertida por Sequoia se derrumbó! Adquirida por Perplexity y cerrada 90 días después

¿Cómo los desarrolladores pueden utilizar los modelos de IA locales de Apple en iOS 26?

Tres rondas de financiación al año, alcanzando los 5.000 millones de dólares ¡Supabase es el más destacado en el círculo de programación!

El lanzamiento interno de Gemini 3.0 Pro de Google se filtra: un gran avance en habilidades de programación, se lanzará la próxima semana

Google anuncia que Gemini en Chrome está disponible en todo el mundo para los usuarios de Workspace

La nueva aplicación de OpenAI Sora alcanza el primer lugar en la tienda de aplicaciones de Apple en cuatro días

¡Los personajes de Mickey Mouse desaparecen! ¡La carta de abogados de Disney golpea a Character.AI y se retiran todos los personajes de la franquicia Disney

¡El navegador de complementos gratuitos ha llegado! Perplexity baja a todos los usuarios el Comet, que cuesta 200 dólares al mes. El asistente de IA que te ayuda a navegar por la web, escribir correos electrónicos, comprar entradas y comparar precios ahora está disponible

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Submit Your Model

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

GEO Services​

AI Search Visibility Checker

AI Model Compatibility Checker

AI Dataset Collection

Intelligent Document Recognition

El modelo de generación de acciones Wan2.2-Animate de Tongyi Wanxiang se ha lanzado oficialmente como código abierto

AIbase基地

Este artículo proviene de AIbase Daily

Noticias de IA relacionadas recomendadas

¡Google lanza una gran sorpresa! Gemini CLI conecta de un solo clic a MCP, los desarrolladores se libran del infierno de configuración

La valoración de OpenAI alcanza los 500 mil millones de dólares ¡Los empleados venden 6.600 millones de dólares! El récord de una empresa privada

¡La herramienta de diseño de IA invertida por Sequoia se derrumbó! Adquirida por Perplexity y cerrada 90 días después

¿Cómo los desarrolladores pueden utilizar los modelos de IA locales de Apple en iOS 26?

Tres rondas de financiación al año, alcanzando los 5.000 millones de dólares ¡Supabase es el más destacado en el círculo de programación!

El lanzamiento interno de Gemini 3.0 Pro de Google se filtra: un gran avance en habilidades de programación, se lanzará la próxima semana

Google anuncia que Gemini en Chrome está disponible en todo el mundo para los usuarios de Workspace

La nueva aplicación de OpenAI Sora alcanza el primer lugar en la tienda de aplicaciones de Apple en cuatro días

¡Los personajes de Mickey Mouse desaparecen! ¡La carta de abogados de Disney golpea a Character.AI y se retiran todos los personajes de la franquicia Disney

¡El navegador de complementos gratuitos ha llegado! Perplexity baja a todos los usuarios el Comet, que cuesta 200 dólares al mes. El asistente de IA que te ayuda a navegar por la web, escribir correos electrónicos, comprar entradas y comparar precios ahora está disponible

GEO Services