ज़िझू टेक्नोलॉजी टीम ने 32B और 9B सीरीज़ के GLM (जनरल लैंग्वेज मॉडल) मॉडल को ओपन सोर्स करने की घोषणा की है, और आधिकारिक तौर पर एक नया इंटरैक्टिव अनुभव प्लेटफ़ॉर्म Z.ai लॉन्च किया है। इस सीरीज़ के मॉडल में बेस मॉडल, इन्फ़्रेंस मॉडल और रुमिनेशन मॉडल शामिल हैं, जो सभी एक लचीले MIT लाइसेंस के तहत हैं, जिससे डेवलपर्स को उपयोग और विकास में बहुत अधिक स्वतंत्रता मिलती है, और इसका उपयोग वाणिज्यिक उद्देश्यों के लिए और मुफ़्त वितरण के लिए किया जा सकता है।

इस बार ओपन सोर्स किया गया 32B बेस मॉडल GLM-4-32B-0414 में 32 अरब पैरामीटर हैं, जिसे 15T उच्च-गुणवत्ता वाले डेटा के साथ प्री-ट्रेन किया गया है, जिसमें विशेष रूप से समृद्ध इन्फ़्रेंस-प्रकार के सिंथेटिक डेटा को शामिल किया गया है। पोस्ट-ट्रेनिंग चरण में, रिजेक्शन सैंपलिंग और रीइन्फ़ोर्समेंट लर्निंग जैसी तकनीकों के माध्यम से, इस मॉडल ने निर्देशों का पालन करने, इंजीनियरिंग कोड जेनरेट करने और फ़ंक्शन कॉल करने जैसे कार्यों में उल्लेखनीय रूप से बेहतर प्रदर्शन दिखाया है, और कुछ बेंचमार्क इंडिकेटर पहले से ही GPT-4o, DeepSeek-V3-0324 (671B) जैसे बड़े मॉडल के स्तर तक पहुँच चुके हैं या उससे भी आगे निकल गए हैं। इसके अलावा, GLM-4-32B-0414 ने कोड जेनरेशन क्षमता को और बेहतर बनाया है, यह अधिक जटिल सिंगल-फ़ाइल कोड को संसाधित और जेनरेट कर सकता है। Z.ai के संवाद मोड में एक पूर्वावलोकन फ़ंक्शन बनाया गया है, जो जेनरेट किए गए HTML और SVG को विज़ुअलाइज़ करने का समर्थन करता है, जिससे उपयोगकर्ता जेनरेट किए गए परिणामों का मूल्यांकन और पुनरावृति अनुकूलन कर सकते हैं।

微信截图_20250415090652.png

इन्फ़्रेंस मॉडल GLM-Z1-32B-0414, GLM-4-32B-0414 के आधार पर, कोल्ड स्टार्ट और एक्सटेंडेड रीइन्फ़ोर्समेंट लर्निंग रणनीति का उपयोग करता है, और गणित, कोड और तर्क जैसे प्रमुख कार्यों के लिए गहन अनुकूलन प्रशिक्षण किया गया है। इस मॉडल ने कुछ कार्यों में 671B पैरामीटर वाले DeepSeek-R1 के बराबर प्रदर्शन किया है, जो एक मजबूत संख्यात्मक तर्क क्षमता दिखाता है, और अधिक व्यापक और जटिल कार्यों को हल करने का समर्थन कर सकता है। उल्लेखनीय है कि GLM-Z1-32B-0414 की वास्तविक इन्फ़्रेंस गति 200 Tokens/सेकंड तक पहुँच सकती है, जो वर्तमान में घरेलू वाणिज्यिक मॉडल में सबसे तेज है, और इसकी कीमत DeepSeek-R1 की केवल 1/30 है।

9B आकार का GLM-Z1-9B-0414 मॉडल उपरोक्त तकनीकों की एक श्रृंखला का उपयोग करता है। हालांकि पैरामीटर की संख्या कम है, फिर भी गणितीय तर्क और सामान्य कार्यों में उत्कृष्ट प्रदर्शन दिखाता है, और समग्र प्रदर्शन समान आकार के ओपन सोर्स मॉडल के अग्रणी स्तर तक पहुँच गया है। विशेष रूप से संसाधनों की कमी वाले परिदृश्यों में, यह मॉडल दक्षता और प्रभाव के बीच एक अच्छा संतुलन बना सकता है, जो हल्के वज़न वाले परिनियोजन की आवश्यकता वाले उपयोगकर्ताओं के लिए एक शक्तिशाली विकल्प प्रदान करता है।

रुमिनेशन मॉडल GLM-Z1-Rumination-32B-0414, ज़िझू द्वारा AGI (आर्टिफिशियल जनरल इंटेलिजेंस, सामान्य कृत्रिम बुद्धिमत्ता) के भविष्य के रूप के लिए अगले चरण की खोज का प्रतिनिधित्व करता है। सामान्य इन्फ़्रेंस मॉडल के विपरीत, रुमिनेशन मॉडल अत्यधिक खुले और जटिल समस्याओं को हल करने के लिए अधिक चरणों के गहन चिंतन का उपयोग करता है। इसका मुख्य नवाचार यह है कि यह गहन चिंतन प्रक्रिया में जटिल कार्यों को संसाधित करने के लिए खोज उपकरणों को एकीकृत कर सकता है, और एंड-टू-एंड रीइन्फ़ोर्समेंट लर्निंग प्रशिक्षण को निर्देशित करने और विस्तारित करने के लिए कई नियम-आधारित पुरस्कार तंत्र का उपयोग कर सकता है। यह मॉडल "स्वतंत्र रूप से प्रश्न पूछना - जानकारी की खोज करना - विश्लेषण का निर्माण करना - कार्य पूरा करना" के एक पूर्ण शोध लूप का समर्थन करता है, जिससे शोध लेखन और जटिल पुनर्प्राप्ति कार्यों में क्षमता में उल्लेखनीय सुधार हुआ है।

微信截图_20250415090630.png

मॉडल के ओपन सोर्स होने के अलावा, बेस और इन्फ़्रेंस मॉडल दोनों को ज़िझू MaaS ओपन प्लेटफ़ॉर्म (bigmodel.cn) पर भी लॉन्च किया गया है, जो उद्यमों और डेवलपर्स को API सेवाएँ प्रदान करता है। इस बार लॉन्च किए गए बेस मॉडल दो संस्करण प्रदान करते हैं: GLM-4-Air-250414 और GLM-4-Flash-250414, जिसमें बाद वाला पूरी तरह से मुफ़्त है। लॉन्च किए गए इन्फ़्रेंस मॉडल तीन संस्करणों में विभाजित हैं, जो विभिन्न परिदृश्य आवश्यकताओं को पूरा करते हैं: GLM-Z1-AirX (अति-तेज़ संस्करण) घरेलू सबसे तेज़ इन्फ़्रेंस मॉडल के रूप में स्थित है, जिसकी इन्फ़्रेंस गति 200 टोकन/सेकंड तक पहुँच सकती है, जो पारंपरिक की तुलना में 8 गुना तेज है; GLM-Z1-Air (उच्च लागत प्रभावशीलता संस्करण) की कीमत DeepSeek-R1 की केवल 1/30 है, जो उच्च-आवृत्ति कॉल परिदृश्यों के लिए उपयुक्त है; GLM-Z1-Flash (मुफ़्त संस्करण) मुफ़्त उपयोग का समर्थन करता है, जिसका उद्देश्य मॉडल के उपयोग की दहलीज को और कम करना है।

इसी समय, ज़िझू ने एक नए डोमेन Z.ai को लॉन्च किया है, यह प्लेटफ़ॉर्म 32B बेस, इन्फ़्रेंस और रुमिनेशन तीन प्रकार के GLM मॉडल को एकीकृत करता है, जो ज़िझू के नवीनतम मॉडल के इंटरैक्टिव अनुभव प्रवेश द्वार के रूप में कार्य करता है, वर्तमान में तीन ओपन सोर्स मॉडल लॉन्च किए गए हैं, और उपयोगकर्ता इस प्लेटफ़ॉर्म पर इन मॉडलों के शक्तिशाली कार्यों का मुफ़्त अनुभव कर सकते हैं।