Der Tencent hat offiziell ein neues Mitglied der Hunyuan-Modellfamilie, das Modell Hunyuan-A13B, veröffentlicht und geöffnet. Das Modell basiert auf einer Mixture-of-Experts-(MoE)-Architektur mit insgesamt 80 Milliarden Parametern und 13 Milliarden aktiven Parametern. Es bietet hervorragende Leistungen bei gleichzeitig deutlich reduziertem Rechenverbrauch und geringerer Verzögerung, wodurch es für Einzelentwickler und kleine Unternehmen eine kosteneffiziente AI-Lösung darstellt.

Laut Angaben von Tencent kann das Modell Hunyuan-A13B in extremen Umgebungen bereits mit nur einer mittelprächtigen GPU-Karte betrieben werden. Benutzer können das Modell über Technologiegemeinschaften wie Github oder HuggingFace herunterladen und verwenden. Die Modell-API ist auch auf der offiziellen Tencent Cloud-Website verfügbar. Diese Eigenschaft ermöglicht es mehr Entwicklern, mit geringen Kosten auf vorausschauende KI-Technologien zuzugreifen und Innovationen zu fördern.

WeChat-Screenshot_20250627155201.png

In Bezug auf die Leistung zeigt das Modell Hunyuan-A13B führende Ergebnisse bei mathematischen, wissenschaftlichen und logischen Schlussfolgerungsaufgaben. Zum Beispiel kann es bei mathematischen Schlussfolgerungstests präzise Dezimalzahlen vergleichen und Schritt-für-Schritt-Analysen zeigen. Darüber hinaus unterstützt das Modell die Ausführung von Tools zur Erzeugung komplexer Anweisungsantworten, wie beispielsweise Reisepläne oder Datenanalysen, und bietet somit eine starke Unterstützung für die Entwicklung von Agent-Anwendungen.

Auf technischer Ebene verbesserte das Modell Hunyuan-A13B durch die Verwendung eines hochwertigen Netzwerkwortkorpus mit 20 Billionen Wörtern seine Fähigkeit zur Inferenz und vervollständigte das Theorie-System der Scaling Law in der MoE-Architektur, um eine messbare Ingenieurleitlinie für die Modellgestaltung bereitzuhalten. Zudem ermöglicht das Modell dem Nutzer, den Denkmodus nach Bedarf auszuwählen: Der schnelle Denkmodus liefert eine kurze und effiziente Ausgabe, während der langsame Denkmodus tiefere Schlussfolgerungsschritte beinhaltet und damit Effizienz und Genauigkeit gleichermaßen berücksichtigt.

Um die Entwicklung der Open-Source-KI-Ökosysteme weiter voranzutreiben, hat Tencent auch zwei neue Datensätze öffentlich gemacht. Der ArtifactsBench wird hauptsächlich für Code-Bewertungen verwendet und enthält einen neuen Benchmark mit 1825 Aufgaben. Der C3-Bench dient der Bewertung von Modellen im Agent-Szenario und wurde mit 1024 Testdaten entworfen, um Schwächen in den Modellfähigkeiten zu identifizieren.

Die Open-Source-Veröffentlichung des Modells Hunyuan-A13B ist ein weiteres Ergebnis der kontinuierlichen Investitionen von Tencent im Bereich KI. In Zukunft wird die Hunyuan-Modellfamilie von Tencent noch weitere Modelle mit unterschiedlichen Größen und Merkmalen veröffentlichen und gemeinsam mit der Community Praxis-Technologien teilen, um die Blüte des Open-Source-Ökosystems zu fördern.

Zugang zum Testen: https://hunyuan.tencent.com/

Open-Source-Adresse: https://github.com/Tencent-Hunyuan