Tencent anuncia el lanzamiento oficial mañana del motor de IA 3D Hunyuan 3.0 (Hunyuan3D AI Engine 2.5), impulsando aún más la innovación en la creación de contenido 3D impulsado por IA. Según AIbase, como versión mejorada de Hunyuan 3D 2.0, se espera que la versión 2.5 logre un gran avance en la generación de geometría, la síntesis de texturas y la velocidad de generación, ofreciendo soluciones más eficientes para el desarrollo de juegos, la realidad virtual y el diseño creativo.

image.png

Mejoras principales: Mayor calidad y velocidad de generación

Basándose en el éxito de Hunyuan 3D 2.0, Hunyuan 3D AI Engine 2.5 optimizará aún más su canal de generación en dos etapas (generación de geometría + síntesis de texturas). AIbase analiza que las mejoras esperadas incluyen:

Mejora de la precisión geométrica: mediante el modelo Hunyuan3D-DiT (Diffusion Transformer) optimizado, la versión 2.5 generará mallas 3D más refinadas, mejorando la representación de los bordes y detalles de estructuras complejas, como rostros humanos y piezas mecánicas.

Mejora de la síntesis de texturas: el modelo Hunyuan3D-Paint admitirá la salida de texturas de mayor resolución, optimizando la consistencia multiperspectiva para garantizar la realidad visual en una perspectiva de 360°.

Aumento de la velocidad de generación: en comparación con el tiempo de generación de 10 a 25 segundos de la versión 2.0, la versión 2.5 podría reducirse a 5 a 15 segundos, especialmente en modelos ligeros (como Hunyuan3D-2mini-Turbo).

Optimización de la entrada multimodal: admite entradas mixtas más complejas de texto e imágenes, permitiendo a los usuarios generar activos 3D altamente personalizados mediante descripciones de lenguaje natural o imágenes de referencia.

La comunidad especula que la versión 2.5 podría integrar el último modelo de generación de texturas RomanTex y la tecnología de generación de materiales PBR MaterialMVP (prevista para el 1 de abril), para admitir la representación en tiempo real y aplicaciones de alta fidelidad. AIbase observa que Hunyuan 3D 2.0 ya ha superado a los competidores de código abierto y cerrado en la evaluación de VBench, y el rendimiento de la versión 2.5 es muy esperado.

Arquitectura técnica: Continuidad e innovación

Hunyuan 3D AI Engine 2.5 continúa con la arquitectura de generación en dos etapas de la versión 2.0, cuyos componentes principales incluyen:

Hunyuan3D-DiT: basado en el transformador de difusión de flujo, se encarga de generar estructuras geométricas 3D de alta precisión, admite la consistencia multiperspectiva y la alineación de imágenes condicionales.

Hunyuan3D-Paint: utiliza la geometría previa y el modelo de difusión para generar texturas de alta resolución, admite el coloreado flexible de mallas dibujadas a mano y generadas.

Hunyuan3D-Studio: plataforma de creación integral, se espera que la versión 2.5 agregue funciones de edición de animación y vista previa en tiempo real para simplificar el flujo de trabajo de usuarios profesionales y aficionados.

AIbase entiende que la versión 2.5 podría introducir la guía libre de clasificador adaptativo (Adaptive Classifier-Free Guidance) 2.0 para mejorar aún más la alineación entre los resultados generados y las condiciones de entrada. Además, los problemas de optimización topológica planteados por la comunidad (como la compatibilidad con la animación esquelética) podrían mejorarse en la versión 2.5 para mejorar su utilidad en el desarrollo de juegos.

Escenarios de aplicación: Potenciación integral desde juegos hasta comercio electrónico

El lanzamiento de Hunyuan 3D AI Engine 2.5 ampliará aún más las aplicaciones de la IA en la creación de contenido 3D. AIbase resume sus escenarios principales:

Desarrollo de juegos: generación rápida de activos de bajo polígono y modelos de personajes de alta fidelidad, aceleración del diseño de niveles y las pruebas de prototipos; Tencent Maps ya ha utilizado Hunyuan 3D para mejorar la eficiencia de generación de iconos de navegación en un 91%.

Realidad virtual y metaverso: generación de entornos 3D inmersivos y personajes dinámicos, compatible con la creación de contenido de RV/RA, mejora la experiencia del usuario.

Comercio electrónico: generación de modelos 3D interactivos para productos, admite la visualización de 360° y el ajuste de materiales en tiempo real, mejora la experiencia de compra del consumidor.

Cine y animación: generación de activos de previsualización y secuencias de animación de alta calidad, reducción de los costes de VFX y postproducción.

AIbase observa que Hunyuan 3D 2.0 ya ha demostrado un gran potencial en la creación de contenido generado por el usuario (UGC) y la síntesis de materiales de productos, y se espera que las mejoras de la versión 2.5 impulsen aún más las aplicaciones comerciales en estos campos.

Guía de inicio: Prioridad al código abierto y la facilidad de uso

Se espera que Hunyuan 3D AI Engine 2.5 continúe con la estrategia de código abierto, y el código y los modelos se publicarán en Hugging Face y GitHub. AIbase ha recopilado los pasos iniciales:

Acceda al sitio web de Hunyuan3D Studio (3d.hunyuan.tencent.com) o al espacio de Hugging Face para descargar el modelo 2.5 y el código de inferencia;

Instale el entorno (Python 3.9+, NVIDIA A100/RTX3090+, se recomiendan 32 GB de RAM), ejecute el script env_install.sh;

Utilice la aplicación Gradio o la API para cargar el modelo, introduzca texto (como "ciudad cyberpunk") o una imagen para generar activos 3D;

Edite texturas, animaciones o exporte en formato glb/obj en Hunyuan3D-Studio.

El ComfyUI-Hunyuan3DWrapper y los complementos de Blender proporcionados por la comunidad seguirán siendo compatibles con la versión 2.5, reduciendo el umbral de implementación. AIbase recomienda a los usuarios que presten atención a la conferencia de prensa de mañana para obtener las últimas actualizaciones de compatibilidad con Windows y el módulo de optimización de 6 GB de VRAM (como Hunyuan3D-2GP).

Respuestas de la comunidad y perspectivas futuras

Desde el lanzamiento de Hunyuan 3D 2.0, su alta puntuación CLIP (0.809) y su capacidad de generación rápida han recibido una alta valoración por parte de la comunidad, pero aún es necesario mejorar los problemas topológicos y la compatibilidad con escenarios complejos. AIbase observa que los desarrolladores esperan que la versión 2.5 optimice la compatibilidad con la animación esquelética y el procesamiento de indicaciones multilingües, y algunos usuarios esperan agregar la función de imagen a vídeo (I2V). Tencent respondió que la versión 2.5 resolverá algunos puntos débiles y planea lanzar el modelo de vídeo Hunyuan en 2025, desafiando a Runway Gen-3 y Luma 1.6. AIbase predice que, a medida que se expanda el ecosistema de Hunyuan 3D, Tencent lanzará el mercado MCP, integrará herramientas como Blender y Unity, y construirá un marco de creación de IA unificado.