Le 30 juillet, l'équipe Tongyi Qianwen d'Alibaba a officiellement lancé le nouveau membre de la série de modèles Qwen3 : Qwen3-30B-A3B-Instruct-2507. Ce modèle open source innovant utilise un mode non réfléchi (non-thinking mode), nécessitant uniquement l'activation de 3 milliards de paramètres pour rivaliser avec des modèles propriétaires connus comme Gemini2.5-Flash et GPT-4o sur plusieurs capacités clés. En outre, Qwen3-30B-A3B-Instruct-2507 a réalisé des progrès notables en matière de prise en charge multilingue, d'alignement des préférences des utilisateurs et de traitement des textes longs.
Ce modèle est désormais pleinement open source sur la communauté ModelScope et la plateforme HuggingFace. En tant que nouvelle version de la série Qwen3-30B-A3B, Qwen3-30B-A3B-Instruct-2507 intègre les avantages de l'équipe Tongyi Qianwen en matière d'innovation architecturale tout en réduisant significativement les coûts de calcul, visant à égaler les performances des modèles propriétaires de l'ordre de plusieurs milliards de paramètres.
Selon les données officielles, Qwen3-30B-A3B-Instruct-2507 s'est distingué dans plusieurs tests standard clés, notamment la raison mathématique (score de 61,3 sur le test AIME25), la génération de code (score de 43,2 sur LiveCodeBenchv6), les problèmes de physique et d'astronomie au niveau du master (score de 70,4 sur le test GPQA) et l'alignement des préférences humaines (score de 69 sur Arena-Hard v2), dépassant même certaines mesures chez GPT-4o. Cet accomplissement marque une amélioration significative des capacités du modèle dans divers domaines tels que le raisonnement logique, les mathématiques, les sciences et la programmation.
Il convient également de noter que Qwen3-30B-A3B-Instruct-2507 montre une excellente couverture des connaissances dans les langues rares et s'aligne mieux avec les préférences des utilisateurs dans les tâches subjectives et ouvertes, générant ainsi des textes de meilleure qualité et fournissant des réponses plus précieuses aux utilisateurs. En outre, sa capacité à comprendre les textes longs a été portée à 256K, ce qui signifie que les utilisateurs peuvent traiter des contenus textuels plus complexes.
Depuis sa sortie en 2023, la série de modèles Tongyi Qianwen a dépassé les 200 modèles open source, avec plus de 3 milliards de téléchargements à l'échelle mondiale et plus de 100 000 modèles dérivés, démontrant une forte influence du marché et un potentiel technologique important.