A Tencent anunciou recentemente o lançamento de seu mais recente modelo de linguagem grande, o Hunyuan-T1, afirmando que o modelo é comparável ao melhor sistema de raciocínio da OpenAI em termos de capacidade de raciocínio.
De acordo com a Tencent, o desenvolvimento do Hunyuan-T1 dependeu fortemente do aprendizado por reforço, com até 96,7% da capacidade computacional pós-treinamento sendo usada para melhorar a capacidade de raciocínio lógico do modelo e sua alinhamento com as preferências humanas.
Em vários testes de referência, o Hunyuan-T1 demonstrou um desempenho robusto. Na avaliação MMLU-PRO, que testa o conhecimento em 14 disciplinas, o modelo obteve uma pontuação de 87,2, ligeiramente abaixo do modelo o1 da OpenAI. Em termos de raciocínio científico, o Hunyuan-T1 obteve 69,3 pontos no teste GPQA-diamond.

Vale destacar o desempenho excepcional do Hunyuan-T1 em matemática. No teste de referência MATH-500, ele obteve uma pontuação de 96,2, ficando atrás apenas do Deepseek-R1. Além disso, o modelo também se destacou na geração de código (LiveCodeBench: 64,9 pontos) e no raciocínio de alta dificuldade (ArenaHard: 91,9 pontos). A Tencent também observou que a precisão do Hunyuan-T1 em várias tarefas em chinês ultrapassa 90%.
No treinamento do modelo, a Tencent adotou um método de aprendizado curricular, aumentando gradualmente a dificuldade das tarefas. Além disso, a empresa inovou ao desenvolver um sistema de recompensa automática, usando versões anteriores do modelo para avaliar a saída de novas versões, impulsionando assim a melhoria contínua do desempenho do modelo.
O Hunyuan-T1 utiliza a arquitetura híbrida Transformer Mamba. A Tencent afirma que, em condições iguais, essa arquitetura processa textos longos duas vezes mais rápido que os modelos tradicionais. Atualmente, o Hunyuan-T1 está disponível publicamente por meio da Tencent Cloud e uma demonstração está disponível no Hugging Face.
Este lançamento representa mais uma medida importante na competição no campo da IA entre gigantes tecnológicos chineses, após o lançamento de modelos desenvolvidos internamente pela Baidu e Alibaba, que alegam atingir o nível do o1. É importante notar que Alibaba, Baidu e Deepseek estão promovendo ativamente estratégias de código aberto. O investidor em inteligência artificial e ex-presidente da Google China, Kai-Fu Lee, declarou publicamente que o desenvolvimento desses modelos de IA chineses representa uma ameaça potencial à sobrevivência da OpenAI.