23 जुलाई को, अलीबेस ने अपने नए AI प्रोग्रामिंग महामॉडल Qwen3-Coder के पूर्ण ओपन सोर्स होने की घोषणा की, जिसके कारण स्मार्ट प्रोग्रामिंग के क्षेत्र में एक गर्मी फैल गई। Qwen3-Coder के अद्वितीय कोड जनरेशन और एजेंट क्षमता के कारण, Agentic Coding, Agentic Browser-Use और बुनियादी प्रोग्रामिंग कार्यों में ओपन सोर्स मॉडल के शीर्ष स्तर पर पहुंच गया है, जो स्मार्ट प्रोग्रामिंग तकनीक के एक नए चरण में प्रवेश को चिह्नित करता है।

Qwen3-Coder मॉडल श्रृंखला में विभिन्न आकार विकल्प प्रदान करती है, इस बार ओपन सोर्स किया गया सबसे शक्तिशाली संस्करण - Qwen3-Coder-480B-A35B-Instruct है। इस मॉडल में उन्नत MoE आर्किटेक्चर का उपयोग किया गया है, जिसमें 480B पैरामीटर हैं, एक्टिवेटेड पैरामीटर 35B हैं, और इसमें मूल रूप से 256K संदर्भ समर्थन है, जिसे YaRN तकनीक के माध्यम से 1M लंबाई तक विस्तारित किया जा सकता है, जो बड़े कोड लाइब्रेरी और डायनामिक डेटा के साथ काम करने के लिए एक मजबूत समर्थन प्रदान करता है।

微信截图_20250723081042.png

प्री-ट्रेनिंग चरण में, टॉंगयी टीम ने बहुआयामी विस्तार रणनीति के माध्यम से Qwen3-Coder के कोड क्षमता को व्यापक रूप से सुधारा। डेटा के मामले में, कुल 7.5T ट्रेनिंग डेटा में कोड का हिस्सा 70% तक है, जो सुनिश्चित करता है कि मॉडल सामान्य और गणितीय क्षमता के साथ-साथ अद्वितीय प्रोग्रामिंग क्षमता रखता है। संदर्भ विस्तार के मामले में, मॉडल में मूल रूप से लंबे संदर्भ प्रोसेसिंग क्षमता है, जो वेबसाइट स्तरीय कोड और डायनामिक डेटा के लिए विशेष रूप से अनुकूलित है, जो Agentic Coding की दक्षता और सटीकता में बहुत वृद्धि करता है। इसके अलावा, संश्लेषित डेटा विस्तार तकनीक के माध्यम से, Qwen2.5-Coder के माध्यम से कम गुणवत्ता वाले डेटा को साफ करके फिर से लिखा गया, जिससे समग्र डेटा गुणवत्ता में और सुधार हुआ।

पश्च ट्रेनिंग चरण में, टॉंगयी टीम ने एक नवाचीन एक्सीक्यूशन-ड्राइवन बड़े पैमाने पर सीखने की रणनीति का उपयोग किया, जिसमें स्वचालित रूप से टेस्ट उदाहरण बनाकर बहुत सारे उच्च गुणवत्ता ट्रेनिंग उदाहरण बनाए गए। इस रणनीति ने कोड एक्सीक्यूशन सफलता को व्यावहारिक रूप से बढ़ाया और अन्य कार्यों पर धनात्मक प्रभाव डाला। विशेष रूप से वास्तविक दुनिया के सॉफ्टवेयर इंजीनियरिंग कार्यों में, जैसे SWE-Bench, Qwen3-Coder ने अद्वितीय स्वयं के योजना, उपकरण उपयोग और निर्णय लेने क्षमता दिखाई, जो SWE-bench Verified पर ओपन सोर्स मॉडल के सबसे अच्छे परिणामों में लाया।

विकासकर्ताओं के लिए उपयोग करना आसान बनाने के लिए, टॉंगयी टीम ने Qwen Code कमांड लाइन उपकरण भी ओपन सोर्स किया, जिसके लिए Qwen3-Coder श्रृंखला मॉडल के लिए विस्तारित पार्सर और उपकरण समर्थन किया गया है, जिससे विकासकर्ता मॉडल के एजेंट आधारित प्रोग्रामिंग में संभावनाओं को अधिक अच्छी तरह से उपयोग कर सकते हैं। साथ ही, Qwen3-Coder के API का उपयोग Claude Code, Cline जैसे उत्कृष्ट प्रोग्रामिंग उपकरणों के साथ सहयोग करने के लिए किया जा सकता है, जो विकासकर्ताओं के लिए अधिक लचीला और कुशल प्रोग्रामिंग अनुभव प्रदान करता है।

वर्तमान में, Qwen3-Coder माजिया समुदाय, HuggingFace आदि मंचों पर पूर्ण रूप से ओपन सोर्स है, जिससे विश्व के विकासकर्ता निःशुल्क डाउनलोड कर सकते हैं। इसके अलावा, यह मॉडल जल्द ही अली के AI प्रोग्रामिंग उत्पाद टॉंगयी लिंगमा में शामिल हो जाएगा, जिससे इसके अनुप्रयोग क्षेत्र और विस्तार होगा। अलीबेस बेसिन प्लेटफॉर्म पर Qwen3-Coder के API भी उपलब्ध हैं, जो विकासकर्ताओं के लिए अधिक सुविधाजनक एक्सेस विकल्प प्रदान करते हैं।

माजिया समुदाय: https://modelscope.cn/models/Qwen/Qwen3-Coder-480B-A35B-Instruct

Hugging Face: https://huggingface.co/Qwen/Qwen3-235B-A22B-Instruct-2507

Qwen Code GitHub: https://github.com/QwenLM/qwen-code