तानग ने मिश्रित बृहत मॉडल परिवार के नए सदस्य - हुनयुआन-ए13बी मॉडल को आधिकारिक रूप से जारी किया और ओपन सोर्स किया। इस मॉडल में मिश्रित विशेषज्ञ (MoE) आर्किटेक्चर का उपयोग किया गया है, जिसका कुल पैरामीटर स्केल 80 बिलियन है, जबकि सक्रिय पैरामीटर 13 बिलियन हैं। इसमें शीर्ष ओपन सोर्स मॉडल के प्रदर्शन को बरकरार रखते हुए, इसने अनुमान देरी और गणना खर्च को बहुत कम कर दिया है, जो व्यक्तिगत विकासकर्ताओं और छोटे व्यवसायों के लिए अधिक मूल्यवान AI समाधान प्रदान करता है।

तानग के अनुसार, हुनयुआन-ए13बी मॉडल चरम परिस्थितियों में केवल एक मध्यम-श्रेणी के GPU कार्ड के साथ इंस्टॉल किया जा सकता है, जिसे टेकनॉलॉजी समुदाय जैसे गिटहब, हफिंगफेस आदि से डाउनलोड किया जा सकता है, और मॉडल API भी तानग क्लाउड की आधिकारिक वेबसाइट पर उपलब्ध है। इस विशेषता के कारण, अधिक विकासकर्ता निम्न लागत पर अग्रणी AI प्रौद्योगिकी के साथ जुड़ सकते हैं, जो नवाचार एप्लिकेशन के लिए लागू होता है।

微信截图_20250627155201.png

प्रदर्शन में, हुनयुआन-ए13बी मॉडल गणित, विज्ञान और तार्किक अनुमान के कार्य में अग्रणी प्रदर्शन दिखाता है। उदाहरण के लिए, गणितीय अनुमान परीक्षण में, मॉडल छोटे दशमलव की तुलना कर सकता है और चरण-दर-चरण विश्लेषण क्षमता दिखा सकता है। इसके अलावा, इस मॉडल में जटिल निर्देशों के उत्तर बनाने के लिए उपकरण के उपयोग का समर्थन है, जैसे यात्रा के लिए योजना, डेटा फाइल विश्लेषण आदि, जो बुद्धिमान एजेंट (एजेंट) एप्लिकेशन विकास के लिए मजबूत समर्थन प्रदान करता है।

तकनीकी रूप से, हुनयुआन-ए13बी मॉडल ने 20 ट्रिलियन उच्च गुणवत्ता वाले नेटवर्क टोकन कॉर्पस का उपयोग पूर्व-प्रशिक्षण में किया, जिससे मॉडल अनुमान क्षमता के ऊपरी सीमा को बढ़ा दिया गया है, और MoE आर्किटेक्चर के Scaling Law सिद्धांत प्रणाली को पूरा कर दिया गया है, जो मॉडल डिजाइन के लिए मापनीय इंजीनियरिंग दिशानिर्देश प्रदान करता है। साथ ही, मॉडल उपयोगकर्ता के आवश्यकता के अनुसार विचार के मोड का चयन कर सकता है, जिसमें तेज विचार के मोड में संक्षिप्त और दक्ष आउटपुट प्रदान किया जाता है, जबकि धीमे विचार के मोड में गहरे अनुमान चरण शामिल होते हैं, जो दक्षता और सटीकता के बीच संतुलन बनाए रखता है।

ओपन सोर्स एआई पारिस्थितिकी तंत्र के विकास को आगे बढ़ाने के लिए, तानग ने दो नए डेटा सेट भी ओपन सोर्स किए। इनमें, ArtifactsBench को कोड मूल्यांकन के लिए उपयोग किया जाता है, जिसमें 1825 कार्यों वाले नए मानक बनाए गए हैं; C3-Bench को एजेंट स्थिति मॉडल मूल्यांकन के लिए डिज़ाइन किया गया है, जिसमें 1024 परीक्षण डेटा है, जिसके माध्यम से मॉडल की क्षमता की कमियां खोजी जा सकती हैं।

हुनयुआन-ए13बी मॉडल के ओपन सोर्स होना, तानग के AI क्षेत्र में लगातार निवेश के एक और परिणाम है। भविष्य में, तानग हुनयुआन महान मॉडल परिवार अधिक आकार और विशेषताओं वाले मॉडल लॉन्च करेगा, समुदाय के साथ अभ्यास प्रौद्योगिकी साझा करेगा और साथ मिलकर ओपन सोर्स पारिस्थितिकी तंत्र के विकास को आगे बढ़ाएगा।

अनुभव का प्रवेश: https://hunyuan.tencent.com/

ओपन सोर्स स्थान: https://github.com/Tencent-Hunyuan