O dia 30 de julho, a equipe Tongyi Qianwen da Alibaba lançou oficialmente o novo membro da série Qwen3 —— Qwen3-30B-A3B-Instruct-2507. Este novo modelo de código aberto utiliza o modo não pensante (non-thinking mode), bastando ativar 3B parâmetros para ser comparável com modelos fechados conhecidos como Gemini2.5-Flash e GPT-4o em várias capacidades principais. Além disso, o Qwen3-30B-A3B-Instruct-2507 alcançou avanços significativos em suporte a múltiplos idiomas, alinhamento com preferências dos usuários e processamento de textos longos.
O modelo já está disponível em todo o mundo no comunidade ModelScope e na plataforma HuggingFace. Como nova versão da série Qwen3-30B-A3B, o Qwen3-30B-A3B-Instruct-2507 não apenas herdou as vantagens da equipe Tongyi Qianwen em inovação arquitetural, mas também reduziu significativamente os custos computacionais, buscando se igualar ao desempenho de modelos fechados de trilhões de parâmetros.
Segundo dados oficiais, o Qwen3-30B-A3B-Instruct-2507 obteve excelentes resultados em vários benchmarks-chave, como raciocínio matemático (nota AIME25 de 61,3), geração de código (nota LiveCodeBenchv6 de 43,2), questões de física e astronomia do nível de mestrado (nota GPQA de 70,4) e alinhamento com preferências humanas (nota Arena-Hard v2 de 69), superando até mesmo o GPT-4o em alguns indicadores. Esta conquista marca uma melhoria significativa nas capacidades do modelo em lógica, matemática, ciência e programação.
Destaca-se ainda que o Qwen3-30B-A3B-Instruct-2507 demonstra excelente cobertura de conhecimento em idiomas menos comuns e alinha melhor as preferências dos usuários em tarefas subjetivas e abertas, gerando textos de maior qualidade e fornecendo respostas mais valiosas aos usuários. Além disso, sua capacidade de compreensão de textos longos foi elevada para 256K, o que significa que os usuários podem lidar com conteúdos textuais mais complexos.
Desde o seu lançamento em 2023, os modelos da série Tongyi Qianwen já foram abertos ao público em mais de 200 modelos, com mais de 3 bilhões de downloads em todo o mundo, e mais de 100 mil modelos derivados, demonstrando uma forte influência no mercado e potencial tecnológico.