O Alibaba Cloud anunciou oficialmente no dia 23 de julho sua nova e mais recente grande modelo de programação com inteligência artificial, o Qwen3-Coder, que está totalmente aberto ao público. Essa iniciativa gerou rapidamente um grande interesse no campo da programação inteligente. O Qwen3-Coder demonstra excelentes capacidades de geração de código e de Agent, alcançando níveis líderes em modelos abertos em tarefas de codificação básica, Agentic Coding e Agentic Browser-Use, marcando assim uma nova fase na tecnologia de programação inteligente.
A série de modelos Qwen3-Coder oferece várias opções de tamanho. A versão mais poderosa, o Qwen3-Coder-480B-A35B-Instruct, foi liberada primeiro. Esse modelo utiliza uma arquitetura avançada MoE, possui até 480B parâmetros, 35B parâmetros ativos e suporta nativamente um contexto de 256K, podendo ser expandido até 1M por meio da tecnologia YaRN, fornecendo suporte poderoso para lidar com grandes bibliotecas de código e dados dinâmicos.
Na fase de pré-treinamento, a equipe Tongyi ampliou significativamente as capacidades de código do Qwen3-Coder por meio de estratégias de expansão multidimensional. Em termos de dados, um total de 7,5T de dados de treinamento contém 70% de código, garantindo que o modelo tenha habilidades excepcionais de programação, mantendo ao mesmo tempo suas capacidades gerais e matemáticas. Em relação à extensão do contexto, a capacidade inata do modelo de processamento de longo contexto é otimizada especificamente para código de repositórios e dados dinâmicos, aumentando significativamente a eficiência e a precisão do Agentic Coding. Além disso, por meio da tecnologia de extensão de dados sintéticos, os dados de baixa qualidade foram limpos e reescritos usando o Qwen2.5-Coder, melhorando ainda mais a qualidade geral dos dados.
Na fase de pós-treinamento, a equipe Tongyi adotou inovadoramente uma estratégia de aprendizado por reforço em larga escala baseada em execução, criando automaticamente muitos exemplos de teste de alta qualidade. Essa estratégia não apenas aumentou significativamente a taxa de sucesso na execução de código, mas também teve impacto positivo em outras tarefas. Em particular, em tarefas de engenharia de software do mundo real, como SWE-Bench, o Qwen3-Coder demonstrou uma excelente capacidade de planejamento autônomo, chamada de ferramentas e tomada de decisão, obtendo os melhores resultados entre modelos abertos no SWE-bench Verified.
Para facilitar o uso pelos desenvolvedores, a equipe Tongyi também liberou o utilitário de linha de comando Qwen Code, que oferece analisadores aprimorados e suporte a ferramentas específicos para a série de modelos Qwen3-Coder, permitindo que os desenvolvedores explorem plenamente o potencial do modelo em programação com agentes. Além disso, a API do Qwen3-Coder pode ser usada em conjunto com ferramentas de programação excelentes como Claude Code e Cline, proporcionando aos desenvolvedores uma experiência de programação mais flexível e eficiente.
Agora, o Qwen3-Coder está totalmente aberto no comunidade ModelScope, HuggingFace e outros plataformas, sendo possível baixá-lo gratuitamente por todos os desenvolvedores ao redor do mundo. Além disso, esse modelo será integrado brevemente aos produtos de programação com inteligência artificial da Alibaba, o Tongyi Lingma, ampliando ainda mais seus cenários de aplicação. A plataforma Alibaba Cloud BaiLian também já lançou a API do Qwen3-Coder, fornecendo uma forma mais conveniente de acesso para os desenvolvedores.
Comunidade ModelScope: https://modelscope.cn/models/Qwen/Qwen3-Coder-480B-A35B-Instruct
Hugging Face: https://huggingface.co/Qwen/Qwen3-235B-A22B-Instruct-2507
GitHub do Qwen Code: https://github.com/QwenLM/qwen-code