Hace poco, Tencent lanzó oficialmente y abrió el código de su nuevo modelo de generación de imágenes multimodal nativo: "HunyuanImage3.0". Este nuevo modelo tiene una escala de parámetros sorprendente de 80B, lo que marca un importante avance tecnológico en el campo de la generación de imágenes. Destaca el hecho de que HunyuanImage3.0 sea el primer modelo industrial de generación de imágenes multimodal con código abierto, y su rendimiento es comparable al de los modelos cerrados líderes del sector.

Las capacidades de este modelo son muy poderosas, ya que puede realizar razonamientos utilizando conocimientos ricos, interpretar semánticas complejas de miles de caracteres y generar textos extensos. Esto representa una gran ventaja para diseñadores y desarrolladores que necesitan crear contenido de alta calidad. Tencent afirma que el lanzamiento de HunyuanImage3.0 impulsará aún más el desarrollo de la tecnología de contenido generado por inteligencia artificial (AIGC).

image.png

Al revisar el desarrollo de la serie Hunyuan, HunyuanImage3.0 es una importante actualización posterior a la versión 2.0 lanzada en mayo de este año. Destaca el hecho de que la versión 2.0 ya logró velocidades de respuesta en milisegundos y una calidad de imagen hiperrealista, permitiendo a los usuarios ver las imágenes generadas en tiempo real al ingresar texto. La versión 3.0 mejora aún más la complejidad y expresividad del modelo sobre esta base.

Además de la generación de imágenes, la serie Hunyuan de Tencent también ha lanzado modelos de generación 3D (versiones 2.0 y 2.5), complementos de generación de imágenes personalizadas InstantCharacter y herramientas de generación de videos multimodales HunyuanCustom, formando así una matriz completa de tecnologías AIGC. La puesta en marcha de estas herramientas no solo mejora la eficiencia de los creadores, sino que también ofrece más posibilidades de innovación para toda la industria.