No fórum da Tencent na Conferência Mundial de Inteligência Artificial 2025, realizada em 27 de julho de 2025, a empresa Tencent anunciou oficialmente a versão 1.0 do modelo de mundo 3D Hunyuan e declarou que o modelo será totalmente aberto ao público. Essa iniciativa marca o nascimento do primeiro modelo gerador de mundos aberto ao público no setor, que suporta imersão, navegação, interação e simulação, abrindo novas possibilidades para jogos, realidade virtual (VR) e criação de conteúdo digital.

O modelo de mundo 3D Hunyuan 1.0 combina geração de visão panorâmica e tecnologia de reconstrução 3D em camadas, podendo aceitar textos e imagens como entrada, gerando rapidamente cenários 3D de alta qualidade e com diversos estilos que podem ser navegados. Essa inovação simplifica significativamente o processo de construção de cenários 3D, pois o trabalho que antes exigia uma equipe especializada por semanas pode agora ser realizado em alguns minutos com apenas instruções de texto simples ou upload de imagens. Para desenvolvedores de jogos, o modelo pode gerar rapidamente cenários 3D completos com elementos como edifícios, terrenos e vegetação, e os arquivos Mesh gerados podem ser usados diretamente para criar protótipos de jogos ou projetar níveis. Além disso, o modelo permite ajustes de objetos dianteiros e substituição de fundos celestes, atendendo às necessidades de criação personalizada. Mesmo usuários comuns sem experiência em modelagem podem usar o motor de criação Hunyuan 3D para gerar facilmente um espaço visual imersivo de 360 graus, que pode ser importado sem problemas em dispositivos de realidade virtual como Vision Pro, proporcionando uma experiência imersiva.

微信截图_20250727111432.png

A principal vantagem do modelo de mundo 3D Hunyuan 1.0 está em seu algoritmo inovador de representação e geração de cenários 3D com hierarquia semântica. Esse algoritmo descompõe o mundo 3D complexo em diferentes níveis semânticos, permitindo a separação inteligente entre primeiro plano e fundo, terra e céu. Não apenas gera cenários globais com aparência visual realista, mas também fornece ativos 3D standardizados, compatíveis com ferramentas principais como Unity, Unreal Engine e Blender, facilitando aos usuários a edição independente dos elementos do cenário ou simulações físicas, alcançando uma integração sem falhas entre a tecnologia AIGC e o fluxo de trabalho tradicional de CG. Em comparação com modelos abertos líderes globais, o modelo de mundo 3D Hunyuan 1.0 supera plenamente em indicadores-chave como qualidade estética e capacidade de seguir instruções nas tarefas de geração de mundo a partir de texto e imagem.

Além disso, a Tencent Hunyuan revelou uma série de planos de abertura ao público, incluindo modelos de linguagem de raciocínio híbrido no lado do terminal, modelos de compreensão multimodal, modelos visuais de jogos, etc. Entre eles, o modelo principal Hunyuan TurboS, desde o início do ano, mantém uma rápida iteração mensal, apresentando melhorias significativas nas habilidades de geração de código, ciências exatas e seguimento de instruções complexas, ocupando uma posição destacada nas listas autoritárias mundiais de grandes modelos. O modelo Hunyuan T1, baseado no núcleo TurboS, aprimora ainda mais as habilidades de raciocínio, demonstrando capacidades abrangentes lideradas no país. Ao mesmo tempo, o modelo de voz de ponta a ponta Hunyuan Voice e o modelo de compreensão multimodal Hunyuan Vision também foram construídos com base no modelo de linguagem grande Hunyuan, herdando excelentes habilidades de compreensão, cognição e raciocínio, obtendo sucessos repetidos no campo de compreensão multimodal.

A Tencent Hunyuan também tem uma abordagem abrangente na geração multimodal, com capacidade de geração 3D globalmente líder. O modelo Hunyuan 3D2.5 mais recentemente lançado teve uma melhoria significativa na qualidade da textura, classificando-se em primeiro lugar no teste da Laboratório de Inteligência Artificial de Xangai. Além do modelo de mundo 3D Hunyuan 1.0, a Tencent também abrirá ao público uma série de modelos pequenos no final do mês, incluindo modelos de raciocínio híbrido de 0,5B, 1,8B, 4B e 7B, sendo mais leves e fáceis de implantar. Além disso, o modelo de compreensão multimodal Hunyuan-large-vision e o framework de geração de vídeo interativo para cenas de jogos, o Hunyuan GameCraft, também serão abertos ao público em breve.

A Tencent Hunyuan também abriu toda a capacidade de geração multimodal e conjunto de ferramentas de plug-in, liberando gradualmente as capacidades líderes no mercado de geração de imagem a partir de texto, geração de vídeo e geração 3D, fornecendo uma base aberta com desempenho próximo ao de modelos comerciais, facilitando a personalização pela comunidade com base em cenários de negócios e uso. Atualmente, o número de downloads da série de modelos Hunyuan 3D ultrapassou 2,3 milhões, tornando-se um dos modelos 3D abertos mais populares do mundo.

Modelo de Mundo 3D Hunyuan 1.0 da Tencent:

● Página do projeto: https://3d-models.hunyuan.tencent.com/world/

● Endereço de experiência: https://3d.hunyuan.tencent.com/sceneTo3D

● Endereço do modelo no Hugging Face: https://huggingface.co/tencent/HunyuanWorld-1

● Endereço do projeto no Github: https://github.com/Tencent-Hunyuan/HunyuanWorld-1.0