आज, Zhipu AI ने नई पीढ़ी के स्टार मॉडल GLM-4.5 का आधिकारिक रूप से लॉन्च किया है, जो एजेंट एप्लिकेशन के लिए डिज़ाइन किया गया एक बुनियादी मॉडल है। अब इस मॉडल के वज़न MIT License ओपन सोर्स लाइसेंस के तहत Hugging Face और ModelScope प्लेटफॉर्म पर ओपन सोर्स किया गया है।
ओपन सोर्स SOTA प्रदर्शन, घरेलू मॉडल अग्रणी
GLM-4.5 में तर्क, कोड और एजेंट की समग्र क्षमताओं में ओपन सोर्स SOTA स्तर पर पहुंच गया है। वास्तविक कोड एजेंट के मानवीय तुलना मूल्यांकन में इसका परीक्षण प्रदर्शन घरेलू अच्छा रहा। 12 सबसे प्रतिनिधि मूल्यांकन बेंचमार्क के साथ समग्र मूल्यांकन के लिए, जैसे MMLU Pro, AIME24, MATH500, SciCode आदि, GLM-4.5 को विश्व मॉडल तीसरा, घरेलू मॉडल पहला, ओपन सोर्स मॉडल पहला अच्छा परिणाम मिला।
तीन मुख्य क्षमताओं का मूल एकीकरण
GLM-4.5 एक ही मॉडल में तर्क, कोडिंग और एजेंट क्षमताओं के मूल एकीकरण के पहले बार किया गया है, जो एजेंट एप्लिकेशन की जटिल आवश्यकताओं को पूरा करता है। यह तकनीकी अभियान Zhipu AI के AGI पहले सिद्धांत के पूर्ण प्रदर्शन को दर्शाता है: मूल क्षमताओं के बिना नुकसान के अधिक सामान्य बुद्धिमत्ता क्षमताओं के एकीकरण।
उच्च पैरामीटर दक्षता की MoE संरचना
GLM-4.5 मिश्रित विशेषज्ञ (MoE) संरचना का उपयोग करता है, जिसमें दो संस्करण होते हैं: GLM-4.5 के कुल पैरामीटर 355 बिलियन हैं, जबकि एक्टिवेटेड पैरामीटर 32 बिलियन हैं; GLM-4.5-Air के कुल पैरामीटर 106 बिलियन हैं, जबकि एक्टिवेटेड पैरामीटर 12 बिलियन हैं। ध्यान दें कि GLM-4.5 के पैरामीटर की संख्या DeepSeek-R1 के 1/2 है, Kimi-K2 के 1/3 है, लेकिन कई मानक बेंचमार्क पर बेहतर प्रदर्शन करता है, SWE-bench Verified सूची में प्रदर्शन/पैरामीटर अनुपात पारेटो अग्रेतर पर है।
दोनों मोड डिज़ाइन और प्रशिक्षण प्रक्रिया
मॉडल दो चलने के मोड का समर्थन करता है: जटिल तर्क और उपकरण उपयोग के लिए सोच मोड, और तत्काल प्रतिक्रिया के लिए गैर-सोच मोड। प्रशिक्षण प्रक्रिया में 15 ट्रिलियन token सामान्य डेटा पर पूर्व-प्रशिक्षण शामिल है, फिर 8 ट्रिलियन token डेटा पर कोड, तर्क, एजेंट क्षेत्रों में विशिष्ट प्रशिक्षण शामिल है, अंत में सुधार शिक्षा के माध्यम से मॉडल क्षमता को आगे बढ़ाया गया।
अद्भुत मूल्य दक्षता उद्योग मूल्य निर्धारण के अंत तक पहुंचा
GLM-4.5 श्रृंखला में लागत और दक्षता में महत्वपूर्ण अंतर आया है, API कॉल की कीमत मुख्य मॉडल की तुलना में बहुत कम है: इनपुट केवल 0.8 रुपए प्रति मिलियन tokens है, आउटपुट 2 रुपए प्रति मिलियन tokens है। उच्च गति वाले संस्करण के अनुमानित उत्पादन गति अधिकतम 100 tokens/सेकंड है, जो कम देरी और उच्च समानांतर प्रतिक्रिया की वास्तविक डेप्लॉयमेंट आवश्यकताओं को समायोजित करता है।
पूर्ण स्टैक विकास क्षमता और पारिस्थितिकी अनुरूपता
GLM-4.5 श्रृंखला पूर्ण स्टैक विकास कार्यों को संभाल सकती है, जैसे अग्र वेबसाइट लिखना, पीछे के डेटाबेस प्रबंधन और उपकरण उपयोग इंटरफेस समर्थन आदि। मॉडल पूर्ण स्टैक प्रोग्रामिंग और उपकरण उपयोग के लिए गहरा अनुकूलन करता है, Claude Code, Cline, Roo Code आदि मुख्य कोड एजेंट फ्रेमवर्क के साथ अनुरूपता करता है, Claude Code फ्रेमवर्क के साथ एक क्लिक के साथ अनुरूपता करता है।
बहु-प्लेटफॉर्म अनुभव और पारदर्शी मूल्यांकन
उपयोगकर्ता BigModel.cn खुले प्लेटफॉर्म से API कॉल कर सकते हैं, या Zhipu Qingyan (chatglm.cn) और z.ai पर मुफ्त अनुभव कर सकते हैं। मूल्यांकन के पारदर्शिता को सुनिश्चित करने के लिए, Zhipu AI ने 52 प्रश्न और एजेंट ट्रैक जारी किए हैं जो उद्योग में जांच और पुनरुत्पादन के लिए उपलब्ध हैं।
GLM-4.5 के लॉन्च ने एजेंट एप्लिकेशन विकास के लिए नई तकनीकी बेस के रूप में अपनाया गया है, इसकी मूल एकीकृत मुख्य क्षमताओं, अद्भुत मूल्य दक्षता और व्यापक पारिस्थितिकी अनुरूपता, AGI तकनीक के व्यापक अनुप्रयोग और व्यावसायिक मूल्य के लिए अपेक्षित है।