23 जुलाई को, अलीबेस ने अपने नए AI प्रोग्रामिंग महामॉडल Qwen3-Coder के पूर्ण ओपन सोर्स होने की घोषणा की, जिसके कारण स्मार्ट प्रोग्रामिंग के क्षेत्र में एक गर्मी फैल गई। Qwen3-Coder के अद्वितीय कोड जनरेशन और एजेंट क्षमता के कारण, Agentic Coding, Agentic Browser-Use और बुनियादी प्रोग्रामिंग कार्यों में ओपन सोर्स मॉडल के शीर्ष स्तर पर पहुंच गया है, जो स्मार्ट प्रोग्रामिंग तकनीक के एक नए चरण में प्रवेश को चिह्नित करता है।
Qwen3-Coder मॉडल श्रृंखला में विभिन्न आकार विकल्प प्रदान करती है, इस बार ओपन सोर्स किया गया सबसे शक्तिशाली संस्करण - Qwen3-Coder-480B-A35B-Instruct है। इस मॉडल में उन्नत MoE आर्किटेक्चर का उपयोग किया गया है, जिसमें 480B पैरामीटर हैं, एक्टिवेटेड पैरामीटर 35B हैं, और इसमें मूल रूप से 256K संदर्भ समर्थन है, जिसे YaRN तकनीक के माध्यम से 1M लंबाई तक विस्तारित किया जा सकता है, जो बड़े कोड लाइब्रेरी और डायनामिक डेटा के साथ काम करने के लिए एक मजबूत समर्थन प्रदान करता है।
प्री-ट्रेनिंग चरण में, टॉंगयी टीम ने बहुआयामी विस्तार रणनीति के माध्यम से Qwen3-Coder के कोड क्षमता को व्यापक रूप से सुधारा। डेटा के मामले में, कुल 7.5T ट्रेनिंग डेटा में कोड का हिस्सा 70% तक है, जो सुनिश्चित करता है कि मॉडल सामान्य और गणितीय क्षमता के साथ-साथ अद्वितीय प्रोग्रामिंग क्षमता रखता है। संदर्भ विस्तार के मामले में, मॉडल में मूल रूप से लंबे संदर्भ प्रोसेसिंग क्षमता है, जो वेबसाइट स्तरीय कोड और डायनामिक डेटा के लिए विशेष रूप से अनुकूलित है, जो Agentic Coding की दक्षता और सटीकता में बहुत वृद्धि करता है। इसके अलावा, संश्लेषित डेटा विस्तार तकनीक के माध्यम से, Qwen2.5-Coder के माध्यम से कम गुणवत्ता वाले डेटा को साफ करके फिर से लिखा गया, जिससे समग्र डेटा गुणवत्ता में और सुधार हुआ।
पश्च ट्रेनिंग चरण में, टॉंगयी टीम ने एक नवाचीन एक्सीक्यूशन-ड्राइवन बड़े पैमाने पर सीखने की रणनीति का उपयोग किया, जिसमें स्वचालित रूप से टेस्ट उदाहरण बनाकर बहुत सारे उच्च गुणवत्ता ट्रेनिंग उदाहरण बनाए गए। इस रणनीति ने कोड एक्सीक्यूशन सफलता को व्यावहारिक रूप से बढ़ाया और अन्य कार्यों पर धनात्मक प्रभाव डाला। विशेष रूप से वास्तविक दुनिया के सॉफ्टवेयर इंजीनियरिंग कार्यों में, जैसे SWE-Bench, Qwen3-Coder ने अद्वितीय स्वयं के योजना, उपकरण उपयोग और निर्णय लेने क्षमता दिखाई, जो SWE-bench Verified पर ओपन सोर्स मॉडल के सबसे अच्छे परिणामों में लाया।
विकासकर्ताओं के लिए उपयोग करना आसान बनाने के लिए, टॉंगयी टीम ने Qwen Code कमांड लाइन उपकरण भी ओपन सोर्स किया, जिसके लिए Qwen3-Coder श्रृंखला मॉडल के लिए विस्तारित पार्सर और उपकरण समर्थन किया गया है, जिससे विकासकर्ता मॉडल के एजेंट आधारित प्रोग्रामिंग में संभावनाओं को अधिक अच्छी तरह से उपयोग कर सकते हैं। साथ ही, Qwen3-Coder के API का उपयोग Claude Code, Cline जैसे उत्कृष्ट प्रोग्रामिंग उपकरणों के साथ सहयोग करने के लिए किया जा सकता है, जो विकासकर्ताओं के लिए अधिक लचीला और कुशल प्रोग्रामिंग अनुभव प्रदान करता है।
वर्तमान में, Qwen3-Coder माजिया समुदाय, HuggingFace आदि मंचों पर पूर्ण रूप से ओपन सोर्स है, जिससे विश्व के विकासकर्ता निःशुल्क डाउनलोड कर सकते हैं। इसके अलावा, यह मॉडल जल्द ही अली के AI प्रोग्रामिंग उत्पाद टॉंगयी लिंगमा में शामिल हो जाएगा, जिससे इसके अनुप्रयोग क्षेत्र और विस्तार होगा। अलीबेस बेसिन प्लेटफॉर्म पर Qwen3-Coder के API भी उपलब्ध हैं, जो विकासकर्ताओं के लिए अधिक सुविधाजनक एक्सेस विकल्प प्रदान करते हैं।
माजिया समुदाय: https://modelscope.cn/models/Qwen/Qwen3-Coder-480B-A35B-Instruct
Hugging Face: https://huggingface.co/Qwen/Qwen3-235B-A22B-Instruct-2507
Qwen Code GitHub: https://github.com/QwenLM/qwen-code