Tencent hat kürzlich angekündigt, seine neue Sprachmodell „**Hunyuan-A13B**“ zu öffnen. Dieses Modell bietet eine innovative **dynamische Inferenzmethode**, die es ermöglicht, je nach Aufgabenkomplexität intelligent zwischen schnellem und tiefem „Denken“ zu wechseln.

QQ20250707-100727.png

Wichtige Merkmale: Dynamische Inferenz und MoE-Architektur

Der Kernvorteil von „**Hunyuan-A13B**“ liegt in der Fähigkeit, die Tiefe der Inferenz **in Echtzeit anzupassen**. Bei einfachen Anfragen aktiviert das Modell den **schnellen Modus**, um schnell mit minimalen Schritten zu antworten; bei komplexeren Fragen kann es jedoch einen **tiefen Inferenzprozess mit mehreren Schritten** aktivieren. Benutzer können diese Funktion auch manuell über spezielle Befehle steuern, indem sie „**/think**“ verwenden, um den tiefen Modus zu aktivieren, oder „**/no_think**“, um den tiefen Modus zu deaktivieren.

Dieses Modell verwendet eine **Mischung aus Experten (MoE)-Architektur**, wobei die Gesamtanzahl der Parameter **80 Milliarden** beträgt. Während der tatsächlichen Inferenz sind jedoch nur **13 Milliarden Parameter aktiv**, was die Effizienz verbessert. Darüber hinaus unterstützt „**Hunyuan-A13B**“ einen maximalen Kontextfensterbereich von **256.000 Tokens**, wodurch die Fähigkeit des Modells, lange Texte zu verarbeiten, deutlich gesteigert wird.

QQ20250707-100733.png

Trainingsdaten und Leistung

Laut einem technischen Bericht von Tencent wurde „**Hunyuan-A13B**“ auf **20 Billionen Tokens** trainiert und für Inferenzaufgaben sowie breitere Anwendungsfälle optimiert. Um die Zuverlässigkeit des Modells bei wissenschaftlichen Aufgaben zu verbessern, hat Tencent speziell **250 Milliarden Tokens aus dem STEM-Bereich** (Wissenschaft, Technologie, Ingenieurwesen und Mathematik) gesammelt, darunter mathematische Lehrbücher, Prüfungen, GitHub-Open-Source-Codes, logische Rätsel und wissenschaftliche Texte bis hin zum College-Niveau.

Tencent behauptet, dass die Version „**Hunyuan-A13B-Instruct**“ mit führenden Modellen wie OpenAI, Deepseek und Alibaba Qwen mithalten kann. Der Bericht zeigt, dass die Genauigkeit von „**Hunyuan-A13B**“ bei der **AIME-Mathematikwettbewerb 2024** **87,3 %** betrug und damit OpenAI o1 mit **74,3 %** übertraf.