Tencent hat kürzlich sein neuestes großes Sprachmodell, Hunyuan-T1, vorgestellt und erklärt, dass es in Bezug auf die Inferenzfähigkeit mit den besten Inferenzsystemen von OpenAI mithalten kann.

Laut Tencent stützt sich die Entwicklung von Hunyuan-T1 stark auf Reinforcement Learning, wobei 96,7 % der Rechenleistung nach dem Training darauf verwendet wurden, die logischen Schlussfolgerungsfähigkeiten des Modells und die Übereinstimmung mit menschlichen Präferenzen zu verbessern.

In mehreren Benchmark-Tests zeigte Hunyuan-T1 eine starke Leistung. Bei der MMLU-PRO-Bewertung, die 14 Fächer umfasst, erzielte das Modell 87,2 Punkte und lag damit nur knapp hinter dem o1-Modell von OpenAI. Im Bereich des wissenschaftlichen Schlussfolgerns erzielte Hunyuan-T1 im GPQA-Diamond-Test 69,3 Punkte.

QQ20250325-095626.png

Besonders hervorzuheben ist die von Tencent hervorgehobene hervorragende Leistung von Hunyuan-T1 in Mathematik. Im MATH-500-Benchmark-Test erzielte es 96,2 Punkte und lag damit nur knapp hinter Deepseek-R1. Darüber hinaus zeigte das Modell auch in Bereichen wie Codegenerierung (LiveCodeBench: 64,9 Punkte) und hochkomplexen Schlussfolgerungen (ArenaHard: 91,9 Punkte) eine hervorragende Leistung. Tencent weist außerdem darauf hin, dass Hunyuan-T1 bei mehreren chinesischen Aufgaben eine Genauigkeit von über 90 % erreicht.

Bei der Modellschulung verwendete Tencent eine Curriculum-Learning-Methode, bei der die Schwierigkeit der Aufgaben schrittweise erhöht wurde. Darüber hinaus entwickelte das Unternehmen ein innovatives Selbstbelohnungssystem, das die Ausgabe neuer Versionen durch frühere Versionen des Modells bewertet und so eine kontinuierliche Verbesserung der Modellleistung ermöglicht.

Hunyuan-T1 verwendet eine Transformer Mamba Hybrid-Architektur. Tencent behauptet, dass diese Architektur unter gleichen Bedingungen die doppelte Geschwindigkeit bei der Verarbeitung langer Texte im Vergleich zu traditionellen Modellen bietet. Derzeit ist Hunyuan-T1 über Tencent Cloud öffentlich zugänglich und eine Demo ist auf Hugging Face verfügbar.

Diese Veröffentlichung ist nach der Vorstellung von Modellen durch Baidu und Alibaba, die angeblich das Niveau von o1 erreichen, ein weiterer wichtiger Schritt im Wettbewerb der chinesischen Technologieunternehmen im Bereich der KI. Bemerkenswert ist, dass Alibaba, Baidu und Deepseek eine aktive Open-Source-Strategie verfolgen. Der KI-Investor und ehemalige Präsident von Google China, Kai-Fu Lee, hat zuvor öffentlich erklärt, dass die Entwicklung dieser chinesischen KI-Modelle eine potenzielle Bedrohung für die Existenz von OpenAI darstellt.