A Tencent anunciou recentemente o lançamento do seu novo modelo de linguagem "**Hunyuan-A13B**", que introduz um método inovador de **raciocínio dinâmico**, permitindo que o modelo alterne inteligentemente entre "pensar rapidamente" e "pensar profundamente", de acordo com a complexidade da tarefa.
Principais destaques: raciocínio dinâmico e arquitetura MoE
O principal benefício do "Hunyuan-A13B" é sua capacidade de **ajustar dinamicamente a profundidade do raciocínio**. Para consultas simples, o modelo ativa o **modo rápido**, respondendo rapidamente com o mínimo de etapas de raciocínio; enquanto enfrenta problemas mais complexos, ele pode ativar um processo de **raciocínio profundo com múltiplas etapas**. Os usuários também podem controlar manualmente esse comportamento por meio de comandos específicos, usando "**/think**" para ativar o modo profundo ou "**/no_think**" para desativá-lo.
O modelo adota uma **arquitetura de Mixture of Experts (MoE)**, com um total de **80 bilhões de parâmetros**, mas apenas **13 bilhões de parâmetros** estão ativos durante o processo de inferência real, o que ajuda a melhorar a eficiência operacional. Além disso, o "Hunyuan-A13B" suporta uma janela de contexto de até **256.000 tokens**, aumentando significativamente sua capacidade de processamento de textos longos.
Dados de treinamento e desempenho
De acordo com o relatório técnico divulgado pela Tencent, o "Hunyuan-A13B" foi treinado em **20 trilhões de tokens** e otimizado para tarefas de raciocínio e casos de uso mais amplos. Para melhorar a confiabilidade do modelo nas tarefas científicas, a Tencent coletou **250 bilhões de tokens** do campo de **STEM (Ciência, Tecnologia, Engenharia e Matemática)** para treinamento, incluindo livros didáticos de matemática, provas, código-fonte do GitHub, enigmas lógicos e textos científicos desde o ensino médio até o universitário.
A Tencent afirma que sua versão "**Hunyuan-A13B-Instruct**" pode competir com modelos líderes como a OpenAI, Deepseek e Alibaba Qwen. O relatório menciona que, no **Campeonato Americano de Matemática AIME de 2024**, a precisão do "Hunyuan-A13B" alcançou **87,3%**, superando os 74,3% da OpenAI o1.