El 19 de mayo de 2025, Bilibili (conocido como B站) anunció la apertura de código de su nuevo modelo de generación de videos animados: Index-AniSora. Esta innovación tecnológica ha revolucionado el campo de la creación de videos en estilos secundarios. Index-AniSora permite generar fácilmente diversos tipos de escenas de videos en estilo secundario con un solo clic, incluidos dramas animados, obras chinas originales, adaptaciones de cómics, VTubers, PVs de animación y animaciones de internet virales, mejorando enormemente la eficiencia y calidad de la producción de contenido animado.
El principio técnico de Index-AniSora se basa en el modelo AniSora propuesto por Bilibili, que ha sido aceptado para presentarse en la conferencia internacional de inteligencia artificial IJCAI2025. Sobre esta base, Bilibili presentó el primer marco de aprendizaje por refuerzo diseñado específicamente para la generación de videos animados. A través de la alineación optimizada utilizando retroalimentación humana en la generación de videos animados, esto mejora significativamente la calidad del contenido generado.
En términos de implementación técnica, el equipo de investigación de Bilibili construyó el primer conjunto de datos de recompensas de alta calidad orientado al campo del anime, que contiene 30,000 muestras de video de anime etiquetadas manualmente. Este conjunto de datos evalúa la calidad del video desde dos aspectos: la apariencia visual y la consistencia visual, cubriendo dimensiones como la suavidad visual, el movimiento visual, la atractividad visual, la consistencia entre texto y video, la consistencia entre imagen y video y la consistencia de los personajes. Basándose en estas dimensiones, el equipo de investigación propuso AnimeReward, un sistema de recompensas multidimensional confiable diseñado específicamente para la alineación de la generación de videos de anime.
Para mejorar aún más el rendimiento de alineación del modelo, el equipo de investigación propuso la optimización de preferencias perceptibles de gap (GAPO), integrando la diferencia de preferencias entre pares de muestras positivas y negativas en la función de pérdida, lo que mejora la eficiencia y el rendimiento final del entrenamiento de alineación. Los resultados experimentales muestran que el modelo optimizado con AnimeReward y GAPO supera significativamente los modelos baseline y los modelos de ajuste supervisado (SFT) en múltiples dimensiones de evaluación, generando videos animados más cercanos a las preferencias humanas.
Este proyecto de código abierto de Bilibili no solo trae nuevas innovaciones técnicas al campo de la generación de videos animados, sino que también proporciona valiosos recursos y herramientas para desarrolladores y entusiastas. A través de Index-AniSora, los usuarios pueden convertir cómics favoritos fácilmente en efectos animados dinámicos, con soporte para varios estilos secundarios poco populares, logrando resultados más ricos y acabando con la era de "animaciones PPT". La apertura de este código sin duda impulsará aún más el desarrollo de la creación de contenido secundario, brindando posibilidades adicionales a los aficionados y creadores de anime.
Dirección:
https://github.com/bilibili/Index-anisora/tree/main
Enlace al modelo:
https://modelscope.cn/models/bilibili-index/Index-anisora
Enlace de experiencia:
https://modelscope.cn/studios/bilibili-index/Anisora