La empresa Xiyu ha logrado un nuevo avance en el campo de la generación de videos y ha lanzado oficialmente el nuevo modelo de generación de videos Hailuo02.
Se informa que Hailuo02 se destaca al procesar escenarios muy complejos como las acciones de gimnasia, siendo actualmente el único modelo en el mundo capaz de lograr este tipo de efectos. Desde que se mostró la página web de demostración del modelo de generación de videos el pasado agosto, el producto de video de la empresa, llamado Nautilus Video, ha ayudado a los creadores a generar más de 370 millones de videos. Con la introducción de Hailuo02, se ha reducido aún más la barrera para la creación de videos y se ha mejorado significativamente la calidad de la creación.
El núcleo de la arquitectura detrás de Hailuo02 es Noise-aware Compute Redistribution (NCR), que bajo la misma cantidad de parámetros mejora la eficiencia de entrenamiento e inferencia en un 2,5 veces. Esto permite que el modelo utilice una escala de parámetros más grande sin aumentar el costo para los creadores, mejorando así su capacidad de expresión. Además, considerando el espacio para optimización de inferencia, el total de parámetros del modelo se ha ampliado hasta tres veces la versión anterior.
Gracias a la mayor cantidad total de parámetros y la mayor eficiencia de entrenamiento, Hailuo02 puede ajustarse a más datos. Con base en los comentarios de los creadores sobre Hailuo01, la cantidad de datos se ha ampliado cuatro veces en comparación con la versión anterior, mejorando significativamente tanto la calidad como la diversidad de los datos. Esto ha llevado a un notable aumento en la capacidad del modelo para seguir instrucciones complejas y representar físicamente fenómenos complejos, asegurando una respuesta completa a instrucciones complejas y ofreciendo mejores respuestas a frases de promp bien redactadas. Además, los creadores pueden generar videos originales en 1080p a precios relativamente asequibles.
En las pruebas del Artificial Analysis Video Arena, una versión temprana de Hailuo02 ocupó el segundo lugar a nivel mundial. Actualmente, este modelo ha sido completamente actualizado en la plataforma Web, la aplicación móvil y la API abierta de Nautilus Video, proporcionando versiones de 768p-6s, 768p-10s y 1080p-6s. Xiyu Technology sigue ofreciendo precios competitivos dentro de la industria y planea realizar rápidas actualizaciones en áreas como la mejora de la velocidad de generación, la alineación de preferencias, la implementación de funciones avanzadas y la exploración de límites entre tecnología y arte.