Le groupe Qwen, sous la marque Alibaba Cloud, a annoncé le lancement de son nouveau modèle d'IA - Qwen3-Max. Ce modèle, grâce à sa taille massive et à ses capacités puissantes, marque une nouvelle avancée dans les technologies de l'intelligence artificielle. Le lancement de Qwen3-Max s'est classé troisième sur le classement de texte LMArena, dépassant ainsi le concurrent GPT-5-Chat, et a montré un excellent comportement sur plusieurs benchmarks, en particulier dans la génération de code et les compétences des agents.
Le modèle Qwen3-Max compte plus de 1 trillion de paramètres, et a été entraîné avec 36 billions de tokens. Grâce à la conception avancée de la structure MoE du série Qwen3, Qwen3-Max a réalisé d'importants progrès en termes de stabilité et d'efficacité d'entraînement. Grâce à la stratégie innovante de parallélisme hiérarchique PAI-FlashMoE, l'efficacité d'entraînement de ce modèle a augmenté de 30 % par rapport aux versions précédentes. Dans les scénarios d'entraînement de séquences longues, la stratégie ChunkFlow utilisée par Qwen3-Max a triplé le débit, permettant l'entraînement d'un contexte long de 1 million de caractères.
Qwen3-Max-Instruct est une composante importante de cette série de modèles, obtenant un excellent score de 69,6 sur le benchmark de programmation SWE-Bench Verified, prouvant ainsi ses compétences exceptionnelles face aux défis pratiques de programmation. De plus, ce modèle a obtenu un score de 74,8 sur le benchmark Tau2-Bench, surpassant ainsi Claude Opus4 et DeepSeek-V3.1, ce qui montre une performance révolutionnaire dans la capacité à utiliser des outils d'agents.
Il convient de noter que la version améliorée de raisonnement de Qwen3-Max - Qwen3-Max-Thinking - a obtenu un score parfait sur les benchmarks exigeants de raisonnement mathématique AIME25 et HMMT, grâce à l'intégration d'un interpréteur de code et de la technologie de calcul parallèle. L'équipe est confiante quant aux perspectives de cette version et attend impatiemment de la rendre disponible sur le marché.
Le groupe Qwen a indiqué que les utilisateurs peuvent maintenant expérimenter directement les capacités puissantes du modèle Qwen3-Max-Instruct via l'API d'Alibaba Cloud. Les API sont désormais accessibles, et les utilisateurs n'ont qu'à suivre quelques étapes simples pour s'inscrire et obtenir une clé API, afin d'utiliser Qwen3-Max pour le développement.
Le lancement de Qwen3-Max ne pousse pas seulement le développement des technologies de l'intelligence artificielle, mais offre également aux développeurs des outils encore plus puissants, les aidant à créer davantage de valeur dans divers domaines. Avec la diffusion de cette technologie, le groupe Qwen est convaincu que l'avenir de l'intelligence artificielle sera encore plus brillant.