चीन के कृत्रिम बुद्धिमत्ता क्षेत्र में नेता जिपू एआई (Zhipu AI) फिर से उद्योग में गर्मी ला रहा है। एआईबेस के अनुसार, हाल ही में जिपू एआई ने अपने नए सामान्य दृश्य मॉडल GLM-4.1V-Thinking को पूरी तरह से खुला स्रोत घोषित कर दिया है। 9 बिलियन पैरामीटर वाला इस बहुमाध्यमी तर्क मॉडल के शानदार प्रदर्शन और व्यापक अनुप्रयोग दृश्य के कारण, यह कई विश्वसनीय मूल्यांकन में रिकॉर्ड तोड़ दिया है और 72 बिलियन पैरामीटर मॉडल के समान या उससे भी बेहतर शक्ति दिखाई है। नीचे AIbase द्वारा संकलित नवीनतम समाचार है, जो आपको इस अभिनव तकनीक के बारे में गहराई से बताएगा।

image.png

चिंतन-शृंखला तर्क के साथ प्रदर्शन में वृद्धि

GLM-4.1V-Thinking जिपू एआई के पूर्व जीएलएम-4वी संरचना पर गहरा अनुकूलन करता है, जिसमें नवाचार के चिंतन-शृंखला तर्क तंत्र (Chain-of-Thought Reasoning) को शामिल किया गया है। इस तंत्र ने जटिल संज्ञानात्मक कार्यों में मॉडल के प्रदर्शन को गहराई से बढ़ा दिया है, जिससे यह छवि, वीडियो और दस्तावेज जैसे बहुमाध्यमी इनपुट को अधिक कुशलता से संसाधित कर सकता है। AIbase के अनुसार, यह मॉडल 28 विश्वसनीय मूल्यांकन (जैसे MMStar, MMMU-Pro, ChartQAPro, OSWorld आदि) में 10 बिलियन पैरामीटर वाले मॉडल के उच्चतम परिणाम तक पहुंच गया है, जिसमें 18 घटनाओं में Qwen-2.5-VL72B मॉडल से बराबर या उससे बेहतर प्रदर्शन दिखाया है, जो इसके आश्चर्यजनक तर्क क्षमता को दर्शाता है।

बहुमाध्यमी क्षमता पूर्ण रूप से कवर करती है, लाखों उद्योगों को बल देती है

GLM-4.1V-Thinking 64K तक के संदर्भ लंबाई और 4K छवि रिजॉल्यूशन का समर्थन करता है, एक साथ चीनी और अंग्रेजी दोनों भाषाओं में काम करता है, जो बहुभाषी स्थितियों में जटिल कार्यों को सुचारू रूप से संसाधित करने में सक्षम बनाता है। लंबे वीडियो की समझ, छवि प्रश्न-उत्तर, विषय बुझाना, लेखन पहचान, दस्तावेज अनुमान, छवि स्थिति (Grounding), GUI एजेंट ऑपरेशन और कोड जनरेशन जैसे कार्यों में यह मॉडल आसानी से निपट सकता है। इसकी खुला स्रोत विशेषता उपयोग के पात्र को कम कर देती है, जिससे एक 3090 ग्राफिक्स कार्ड द्वारा चलाया जा सकता है, और मुफ्त व्यावसायिक अनुमति व्यवसाय और विकासकर्ताओं के लिए व्यापक अनुप्रयोग स्थान प्रदान करती है। AIbase का मानना है कि इस स्थिरता और उच्च प्रदर्शन के संयोजन ने शिक्षा, वित्त, चिकित्सा आदि उद्योगों में एआई तकनीक के लागू होने में बहुत मदद की है।

खुला स्रोत रणनीति, वैश्विक एआई प्रतिस्पर्धा के नेता

जिपू एआई ने GLM-4.1V-Thinking को पूरी तरह से खुला स्रोत घोषित करने का चयन किया है, और Hugging Face प्लेटफॉर्म के माध्यम से मॉडल वजन और प्रदर्शन की पेशकश करता है, जो एआई तकनीक के विस्तार के लिए इसके निर्णय को दर्शाता है। AIbase नोट करता है कि जिपू एआई हाल के वर्षों में खुला स्रोत क्षेत्र में काफी गतिविधि कर रहा है, और जीएलएम श्रृंखला मॉडल के कुल विश्व स्तर पर 30 मिलियन से अधिक डाउनलोड किए गए हैं, जो चीन एआई पारिस्थितिकी तंत्र का महत्वपूर्ण हिस्सा बन गए हैं। इस खुला स्रोत GLM-4.1V-Thinking विकासकर्ताओं के लिए एक उच्च प्रदर्शन बहुमाध्यमी तर्क उपकरण प्रदान करता है, और MIT लाइसेंस के माध्यम से व्यावसायिक अनुप्रयोग की लचीलापन सुनिश्चित करता है, जिससे जिपू एआई के वैश्विक एआई क्षेत्र में प्रतिस्पर्धा क्षमता को और मजबूत किया जाता है।

वैश्विक शीर्ष मॉडल के साथ सीधा टक्कर

प्रदर्शन की तुलना में, GLM-4.1V-Thinking उल्लेखनीय क्षमता दिखाता है। AIbase के संयुक्त मूल्यांकन डेटा के अनुसार, यह मॉडल कई जटिल कार्यों में अच्छा प्रदर्शन करता है, विशेष रूप से STEM विषय प्रश्नों और लंबे दस्तावेज के समझ जैसे उच्च कठिनाई वाले स्थितियों में, कुछ प्रदर्शन ओपनएआई के GPT-4o मॉडल से भी बेहतर हो गए हैं। ऐसा प्रगति दर्शाता है कि जिपू एआई बहुमाध्यमी तर्क क्षेत्र में वैश्विक नेता बन गए हैं और ओपनएआई, गूगल आदि अंतरराष्ट्रीय बड़े निकायों के साथ सीधी टक्कर कर रहा है।

चीन एआई के उदय का नया अध्याय

चीन एआई क्षेत्र में "नए चार बाघों" में से एक के रूप में, जिपू एआई ने लगातार तकनीकी नवाचार और खुले पारिस्थितिकी रणनीति के माध्यम से वैश्विक एआई के परिदृश्य को बदल रहा है। AIbase का मानना है कि GLM-4.1V-Thinking के जारी करने से जिपू एआई की तकनीकी क्षमता के प्रदर्शन के साथ-साथ चीन एआई उद्योग के वैश्विक मंच पर एक महत्वपूर्ण घोषणा हो रही है। भविष्य में, जब अधिक विकासकर्ता GLM-4.1V-Thinking के आधार पर नवाचार एप्लिकेशन बनाएंगे, तो चीन एआई के अंतरराष्ट्रीय प्रभाव और बढ़ेगा।

निष्कर्ष