Tencent anunció recientemente el lanzamiento de su último modelo de lenguaje grande, Hunyuan-T1, afirmando que su capacidad de razonamiento es comparable a la de los mejores sistemas de razonamiento de OpenAI.
Según Tencent, el desarrollo de Hunyuan-T1 se basó en gran medida en el aprendizaje por refuerzo, con un 96,7% de la potencia de cálculo posterior al entrenamiento dedicada a mejorar la capacidad de razonamiento lógico del modelo y su alineación con las preferencias humanas.
En varias pruebas de referencia, Hunyuan-T1 mostró un rendimiento excepcional. En la evaluación MMLU-PRO, que evalúa el conocimiento en 14 disciplinas académicas, el modelo obtuvo una puntuación de 87,2, ligeramente inferior al modelo o1 de OpenAI. En razonamiento científico, Hunyuan-T1 obtuvo una puntuación de 69,3 en la prueba GPQA-diamond.

Cabe destacar el excelente rendimiento de Hunyuan-T1 en matemáticas. Obtuvo una puntuación de 96,2 en la prueba de referencia MATH-500, solo superado por Deepseek-R1. Además, el modelo mostró un rendimiento sobresaliente en la generación de código (LiveCodeBench: 64,9 puntos) y en el razonamiento de alta dificultad (ArenaHard: 91,9 puntos). Tencent también señaló que Hunyuan-T1 supera el 90% de precisión en varias tareas en chino.
En el entrenamiento del modelo, Tencent empleó un método de aprendizaje por etapas, aumentando gradualmente la dificultad de las tareas. Además, la compañía desarrolló de forma innovadora un sistema de recompensa automática, utilizando versiones anteriores del modelo para evaluar la salida de las nuevas versiones, impulsando así la mejora continua del rendimiento del modelo.
Hunyuan-T1 utiliza la arquitectura híbrida Transformer Mamba. Tencent afirma que, en condiciones iguales, esta arquitectura procesa textos largos al doble de velocidad que los modelos tradicionales. Actualmente, Hunyuan-T1 está disponible a través de Tencent Cloud y se ofrece una demostración en Hugging Face.
Este lanzamiento es otra medida importante en la competencia en el campo de la IA entre los gigantes tecnológicos chinos, tras los lanzamientos de Baidu y Alibaba de sus modelos propios que, según afirman, alcanzan el nivel de o1. Es notable que Alibaba, Baidu y Deepseek están promoviendo activamente estrategias de código abierto. El inversor en inteligencia artificial y ex presidente de Google China, Kai-Fu Lee, declaró públicamente que el desarrollo de estos modelos de IA chinos representa una amenaza potencial para la supervivencia de OpenAI.