El 23 de julio, Alibaba Cloud anunció oficialmente que su nuevo modelo de programación de inteligencia artificial Qwen3-Coder está completamente abierto al público, lo que rápidamente generó un gran interés en el ámbito de la programación inteligente. Qwen3-Coder destaca por su extraordinaria capacidad para generar código y sus habilidades de Agente, logrando niveles excelentes en tareas de programación básica, Agentic Coding y Agentic Browser-Use, marcando así una nueva etapa en la tecnología de programación inteligente.

La serie de modelos Qwen3-Coder ofrece varias opciones de tamaño. En esta ocasión, se ha abierto al público primero la versión más potente: Qwen3-Coder-480B-A35B-Instruct. Este modelo utiliza una arquitectura MoE avanzada, tiene hasta 480 mil millones de parámetros, 35 mil millones de parámetros activos y soporta originalmente un contexto de 256K, pudiendo extenderse hasta 1 millón de longitudes mediante la tecnología YaRN, proporcionando un fuerte apoyo para procesar grandes bibliotecas de código y datos dinámicos.

微信截图_20250723081042.png

En la fase de preentrenamiento, el equipo de Tongyi mejoró significativamente las capacidades de código de Qwen3-Coder mediante una estrategia de expansión multidimensional. En cuanto a los datos, un total de 7,5 TB de datos de entrenamiento tienen un 70% de contenido de código, asegurando que el modelo mantenga capacidades generales y matemáticas, además de una excelente capacidad de programación. En términos de ampliación del contexto, la capacidad del modelo para manejar contextos largos está optimizada específicamente para código de repositorios y datos dinámicos, mejorando enormemente la eficiencia y precisión del Agentic Coding. Además, mediante la tecnología de extensión de datos sintéticos, el equipo de Tongyi utilizó Qwen2.5-Coder para limpiar y reescribir datos de baja calidad, mejorando así la calidad general de los datos.

En la fase de postentrenamiento, el equipo de Tongyi adoptó estratégicamente una gran cantidad de aprendizaje por refuerzo dirigido por la ejecución, construyendo automáticamente muchos ejemplos de prueba de alta calidad. Esta estrategia no solo mejoró significativamente la tasa de éxito de la ejecución de código, sino que también tuvo un impacto positivo en otras tareas. En especial, en tareas de ingeniería de software del mundo real, como SWE-Bench, Qwen3-Coder mostró una excelente capacidad de planificación autónoma, llamada de herramientas y toma de decisiones, logrando el mejor resultado entre los modelos abiertos en SWE-bench Verified.

Para facilitar el uso por parte de los desarrolladores, el equipo de Tongyi también abrió al público la herramienta de línea de comandos Qwen Code, que incluye un analizador mejorado y soporte de herramientas para la serie de modelos Qwen3-Coder, permitiendo a los desarrolladores aprovechar plenamente el potencial del modelo en la programación basada en agentes. Además, la API de Qwen3-Coder también puede integrarse con herramientas de programación destacadas como Claude Code y Cline, ofreciendo a los desarrolladores una experiencia de programación más flexible y eficiente.

Actualmente, Qwen3-Coder está completamente abierto en comunidades como ModelScope y HuggingFace, y los desarrolladores de todo el mundo pueden descargarlo gratuitamente. Además, el modelo pronto se integrará en el producto de programación de inteligencia artificial de Alibaba, Tongyi Lingma, ampliando aún más sus escenarios de aplicación. La plataforma de Alibaba Cloud BaiLian también ha lanzado la API de Qwen3-Coder, ofreciendo a los desarrolladores una forma más conveniente de acceder a ella.

Comunidad ModelScope: https://modelscope.cn/models/Qwen/Qwen3-Coder-480B-A35B-Instruct

Hugging Face: https://huggingface.co/Qwen/Qwen3-235B-A22B-Instruct-2507

GitHub de Qwen Code: https://github.com/QwenLM/qwen-code