Le matin du 23 juillet, Alibaba a officiellement lancé son nouveau modèle d'intelligence artificielle de programmation open source — Qwen3-Coder. Ce modèle marque une grande avancée dans la série Qwen, et utilise une architecture Mixture of Experts (MoE), avec un nombre de paramètres allant jusqu'à 48 milliards, dont 3,5 milliards sont activés. Qwen3-Coder se distingue parmi les modèles de programmation open source, et sa performance est comparable à celle des meilleurs modèles mondiaux comme Claude4.
Qwen3-Coder a été pré-entraîné sur un ensemble de données comprenant 7,5 téraoctets de données, dont 70 % sont du code. Sa conception supporte un contexte de 256 000 tokens, pouvant être étendu jusqu'à 1 million de tokens, offrant aux développeurs une plus grande adaptabilité aux scénarios de programmation. Pendant la phase d'apprentissage renforcé ultérieur, le modèle a été profondément optimisé pour les tâches de programmation et les tâches d'agents, améliorant significativement ses capacités générales, sa capacité au code et ses compétences en matière d'agents.
Dans plusieurs évaluations, Qwen3-Coder s'est révélé performant. Sur des plateformes comme WebArena, il dépasse GPT4.1, et lors de l'évaluation SWE-Bench qui examine la capacité à planifier indépendamment la résolution de tâches de programmation, Qwen3-Coder a obtenu le meilleur résultat parmi les modèles open source. Son excellente capacité en matière d'agents le rend particulièrement adapté à la gestion de tâches complexes en plusieurs étapes, capable de gérer lui-même son travail et d'utiliser efficacement divers outils pour résoudre rapidement des problèmes de programmation complexes.
En outre, Qwen3-Coder réduit considérablement la barrière à l'entrée de la programmation, permettant même aux personnes ordinaires de réaliser facilement leurs souhaits de programmation. Les développeurs n'ont qu'à donner une simple commande pour générer un processus complexe de simulation physique 3D. Cela non seulement améliore l'efficacité du travail de programmation, raccourcissant des tâches qui prenaient des heures en quelques minutes, mais aussi facilite l'amélioration de nombreux domaines d'applications intelligentes tels que le développement web ou la recherche AI.
Qwen3-Coder est maintenant open source sur la communauté ModelScope, HuggingFace et d'autres plateformes, permettant aux développeurs du monde entier de le télécharger gratuitement. De plus, il sera intégré à l'application de programmation AI d'Alibaba, Tongyi Lingma, et disponible via l'API Alibaba Cloud BaiLian, facilitant ainsi son utilisation par les développeurs. Pour améliorer l'expérience utilisateur, l'équipe Tongyi a également lancé un outil en ligne de commande appelé Qwen Code, aidant les développeurs à mieux exploiter cet outil puissant.