Tencent Open Source Hunyuan-A13B: modelo de grande porte de raciocínio dinâmico, destaque é a capacidade de pensar

AIbase基地

Publicado emNotícias e Informações de IA · 4 minutos de leitura · Jul 7, 2025

3

A Tencent anunciou recentemente o lançamento do seu novo modelo de linguagem "**Hunyuan-A13B**", que introduz um método inovador de **raciocínio dinâmico**, permitindo que o modelo alterne inteligentemente entre "pensar rapidamente" e "pensar profundamente", de acordo com a complexidade da tarefa.

Principais destaques: raciocínio dinâmico e arquitetura MoE

O principal benefício do "Hunyuan-A13B" é sua capacidade de **ajustar dinamicamente a profundidade do raciocínio**. Para consultas simples, o modelo ativa o **modo rápido**, respondendo rapidamente com o mínimo de etapas de raciocínio; enquanto enfrenta problemas mais complexos, ele pode ativar um processo de **raciocínio profundo com múltiplas etapas**. Os usuários também podem controlar manualmente esse comportamento por meio de comandos específicos, usando "**/think**" para ativar o modo profundo ou "**/no_think**" para desativá-lo.

O modelo adota uma **arquitetura de Mixture of Experts (MoE)**, com um total de **80 bilhões de parâmetros**, mas apenas **13 bilhões de parâmetros** estão ativos durante o processo de inferência real, o que ajuda a melhorar a eficiência operacional. Além disso, o "Hunyuan-A13B" suporta uma janela de contexto de até **256.000 tokens**, aumentando significativamente sua capacidade de processamento de textos longos.

Dados de treinamento e desempenho

De acordo com o relatório técnico divulgado pela Tencent, o "Hunyuan-A13B" foi treinado em **20 trilhões de tokens** e otimizado para tarefas de raciocínio e casos de uso mais amplos. Para melhorar a confiabilidade do modelo nas tarefas científicas, a Tencent coletou **250 bilhões de tokens** do campo de **STEM (Ciência, Tecnologia, Engenharia e Matemática)** para treinamento, incluindo livros didáticos de matemática, provas, código-fonte do GitHub, enigmas lógicos e textos científicos desde o ensino médio até o universitário.

A Tencent afirma que sua versão "**Hunyuan-A13B-Instruct**" pode competir com modelos líderes como a OpenAI, Deepseek e Alibaba Qwen. O relatório menciona que, no **Campeonato Americano de Matemática AIME de 2024**, a precisão do "Hunyuan-A13B" alcançou **87,3%**, superando os 74,3% da OpenAI o1.

Este artigo é do AIbase Daily

Bem-vindo à coluna [AI Daily]! Este é o seu guia para explorar o mundo da inteligência artificial todos os dias. Todos os dias apresentamos os destaques da área de IA, com foco nos desenvolvedores, para o ajudar a obter insights sobre as tendências tecnológicas e a compreender as aplicações inovadoras de produtos de IA.

—— Criado pelo Grupo AIbase Daily

Product Finder

Product Submit

AI Models Finder

MCP Servers

MCP Client

MCP Inspector

Case Tutorials

Latest AI News

AI Daily Brief

Tencent Open Source Hunyuan-A13B: modelo de grande porte de raciocínio dinâmico, destaque é a capacidade de pensar

AIbase基地

Este artigo é do AIbase Daily