टेनसेंट ने हाल ही में अपने नवीनतम बड़े भाषा मॉडल - हुनयुआन-टी1 को लॉन्च करने की घोषणा की है, और कहा है कि यह मॉडल तर्क क्षमता में ओपनएआई के सर्वश्रेष्ठ तर्क प्रणाली के बराबर है।
टेनसेंट के अनुसार, हुनयुआन-टी1 के विकास में प्रबलित शिक्षण पर बहुत अधिक निर्भरता है, 96.7% प्रशिक्षण के बाद की संगणना शक्ति का उपयोग मॉडल की तार्किक तर्क क्षमता और मानवीय प्राथमिकताओं के अनुरूपता को बेहतर बनाने के लिए किया गया है।
कई बेंचमार्क परीक्षणों में, हुनयुआन-टी1 ने शक्तिशाली प्रदर्शन दिखाया है। 14 विषयों के ज्ञान का परीक्षण करने वाले MMLU-PRO मूल्यांकन में, इस मॉडल ने 87.2 अंक प्राप्त किए, जो ओपनएआई के o1 मॉडल से थोड़ा ही कम है। वैज्ञानिक तर्क के मामले में, हुनयुआन-टी1 ने GPQA-डायमंड परीक्षण में 69.3 अंक प्राप्त किए।

विशेष रूप से उल्लेखनीय यह है कि टेनसेंट ने गणित में हुनयुआन-टी1 के उत्कृष्ट प्रदर्शन पर ज़ोर दिया है। MATH-500 बेंचमार्क परीक्षण में इसने 96.2 अंक प्राप्त किए, जो केवल Deepseek-R1 से कम है। इसके अलावा, इस मॉडल ने कोड जेनरेशन (LiveCodeBench: 64.9 अंक) और उच्च कठिनाई वाले तर्क (ArenaHard: 91.9 अंक) जैसे क्षेत्रों में भी उत्कृष्ट प्रदर्शन किया है। टेनसेंट ने यह भी बताया कि हुनयुआन-टी1 कई चीनी भाषा कार्यों में 90% से अधिक सटीकता प्राप्त करता है।
मॉडल प्रशिक्षण के संबंध में, टेनसेंट ने पाठ्यक्रम अधिगम पद्धति का उपयोग किया है, जिससे कार्यों की कठिनाई धीरे-धीरे बढ़ती है। इसके अलावा, कंपनी ने स्व-पुरस्कार प्रणाली को नवीन रूप से विकसित किया है, जो मॉडल के पुराने संस्करणों का उपयोग नए संस्करणों के आउटपुट का मूल्यांकन करने के लिए करती है, जिससे मॉडल के प्रदर्शन में निरंतर सुधार होता है।
हुनयुआन-टी1 ने ट्रांसफॉर्मर माम्बा मिश्रित आर्किटेक्चर का उपयोग किया है, टेनसेंट का दावा है कि समान परिस्थितियों में, यह आर्किटेक्चर पारंपरिक मॉडल की तुलना में लंबे पाठ को दोगुनी गति से संसाधित करता है। वर्तमान में, हुनयुआन-टी1 टेनसेंट क्लाउड के माध्यम से बाहरी रूप से उपलब्ध है, और इसका प्रदर्शन Hugging Face पर भी उपलब्ध है।
यह रिलीज़, बैडू और अलीबाबा द्वारा अपने स्वयं के विकसित मॉडल लॉन्च करने के बाद, जो o1 स्तर तक पहुँचने का दावा करते हैं, AI क्षेत्र में चीनी तकनीकी दिग्गजों के बीच प्रतिस्पर्धा का एक और महत्वपूर्ण कदम है। ध्यान देने योग्य बात यह है कि अलीबाबा, बैडू और Deepseek सभी सक्रिय रूप से ओपन-सोर्स रणनीति को आगे बढ़ा रहे हैं। कृत्रिम बुद्धिमत्ता निवेशक और पूर्व गूगल चीन के अध्यक्ष ली कैफू ने पहले सार्वजनिक रूप से कहा था कि ये चीनी AI मॉडल ओपनएआई के लिए एक संभावित अस्तित्वगत खतरा हैं।




