Am 23. Juli gab Alibaba Cloud offiziell bekannt, dass sein neuestes AI-Programmier-Modell Qwen3-Coder vollständig Open Source wird. Dieser Schritt löste schnell eine Welle der Begeisterung im Bereich der intelligenten Programmierung aus. Qwen3-Coder erreicht mit seiner hervorragenden Code-Generierungsfähigkeit und Agent-Fähigkeit führende Leistungen bei agen-tischer Programmierung, agen-tischem Browser-Use und grundlegenden Programmieraufgaben und markiert einen neuen Abschnitt in der Entwicklung der intelligenten Programmierungstechnologie.
Die Qwen3-Coder Modellreihe bietet verschiedene Größenoptionen. Das zunächst geöffnete Modell ist die stärkste Version – Qwen3-Coder-480B-A35B-Instruct. Das Modell verwendet eine fortschrittliche MoE-Architektur mit einer Parameteranzahl von bis zu 480B, wobei 35B aktiviert sind. Es unterstützt native 256K Kontext und kann über die YaRN-Technologie auf eine Länge von 1M erweitert werden, was eine starke Unterstützung für die Verarbeitung großer Code-Bibliotheken und dynamischer Daten bietet.
Im Vortrainingsstadium verbesserte das Tongyi-Team die Code-Fähigkeiten von Qwen3-Coder durch umfassende Erweiterungsstrategien. In Bezug auf die Daten betrug der Anteil des Codes in den insgesamt 7,5 TByte Trainingsdaten 70 %, was sicherstellt, dass das Modell neben allgemeinen und mathematischen Fähigkeiten auch exzellente Programmierfähigkeiten besitzt. In Bezug auf die Erweiterung des Kontexts verfügt das Modell über eine natürliche Fähigkeit zur Verarbeitung langer Kontexte, die speziell für Repository-Code und dynamische Daten optimiert wurde und die Effizienz und Genauigkeit der agen-tischen Programmierung stark steigert. Darüber hinaus verbesserte die Technologie der synthetischen Daten-Erweiterung durch die Reinigung und Neuschreibung von schlechten Daten mit Qwen2.5-Coder die Qualität der gesamten Daten weiter.
Im Nachtrainingsstadium setzte das Tongyi-Team eine innovative Strategie des massenhaften verstärkenden Lernens ein, das auf Ausführungsschwerpunkten basiert. Durch automatisches Erweitern von Testbeispielen wurden viele hochwertige Trainingsbeispiele konstruiert. Diese Strategie erhöhte nicht nur die Erfolgsquote bei der Code-Ausführung deutlich, sondern hatte auch positive Auswirkungen auf andere Aufgaben. Insbesondere bei realen Software-Ingenieur-Aufgaben wie SWE-Bench zeigte Qwen3-Coder ausgezeichnete Fähigkeiten zur eigenständigen Planung, Werkzeugaufruf und Entscheidungsfindung und erreichte damit die beste Leistung bei SWE-bench Verified unter Open-Source-Modellen.
Um Entwicklern die Nutzung zu erleichtern, hat das Tongyi-Team auch das Befehlszeilentool Qwen Code öffentlich gemacht. Dieses Tool verfügt über erweiterte Parser- und Werkzeugunterstützung für die Qwen3-Coder Modellreihe, wodurch Entwickler die Potenzial der Modellfunktionen im agentbasierten Programmieren besser ausschöpfen können. Gleichzeitig können die APIs von Qwen3-Coder mit anderen hervorragenden Programmierungstools wie Claude Code und Cline koordiniert werden und bieten Entwicklern somit eine flexiblere und effizientere Programmiererfahrung.
Derzeit ist Qwen3-Coder in Communities wie ModelScope und HuggingFace vollständig open source und kann weltweit kostenlos heruntergeladen und verwendet werden. Darüber hinaus wird das Modell bald in Alis AI-Programmierprodukt Tongyi Lingma integriert und seine Anwendungsbereiche werden dadurch weiter erweitert. Der Alibaba Cloud BaiLian-Plattform hat ebenfalls die API von Qwen3-Coder eingeführt und bietet Entwicklern so eine bequemere Zugangsweise.
ModelScope Community: https://modelscope.cn/models/Qwen/Qwen3-Coder-480B-A35B-Instruct
Hugging Face: https://huggingface.co/Qwen/Qwen3-235B-A22B-Instruct-2507
Qwen Code GitHub: https://github.com/QwenLM/qwen-code