Recentemente, a Mistral AI colaborou com a All Hands AI para lançar uma série de modelos de linguagem grande voltada para desenvolvedores, chamada Devstral2507, que inclui dois novos modelos: Devstral Small1.1 e Devstral Medium2507. Esses modelos são projetados para apoiar o raciocínio de código baseado em agentes inteligentes, síntese de programas e execução de tarefas estruturadas, sendo adequados para aplicações práticas em grandes bibliotecas de código de software. Esta release foi otimizada em termos de desempenho e custo, oferecendo potencial de aplicação amplo em ferramentas de desenvolvimento e sistemas de automação de código.

image.png

O Devstral Small1.1 é um modelo de código aberto, baseado no modelo fundamental Mistral-Small-3.1, com aproximadamente 24 bilhões de parâmetros. Esse modelo suporta uma janela de contexto de 128k, capaz de processar entradas de código com múltiplos arquivos e prompts complexos longos, correspondendo às características dos fluxos de trabalho da engenharia de software. Essa versão foi especialmente ajustada para saídas estruturadas, incluindo formatos XML e chamadas de funções, tornando-a compatível com frameworks de agentes como o OpenHands, ideal para tarefas como navegação de programa, edição em etapas múltiplas e pesquisa de código. A licença do Devstral Small1.1 é a Apache2.0, permitindo uso em pesquisas e em atividades comerciais.

No que diz respeito aos testes de desempenho, o Devstral Small1.1 obteve 53,6% na prova SWE-Bench Verified, provando que se sai bem ao gerar correções corretas para problemas reais do GitHub. Embora seu desempenho não seja tão bom quanto o de modelos comerciais maiores, ele encontrou um equilíbrio entre tamanho, custo de raciocínio e capacidade de raciocínio, sendo adequado para várias tarefas de codificação.

Além disso, o modelo foi lançado em vários formatos, incluindo versões quantizadas que podem ser usadas para raciocínio local em GPUs de alta memória (como RTX4090) ou máquinas com mais de 32GB de RAM Apple Silicon. Além disso, a Mistral fornece o modelo por meio de sua API de raciocínio, com tarifas atuais iguais às dos modelos da série Mistral-Small.

O Devstral Medium2507 está disponível apenas por meio da API Mistral ou protocolos de implantação corporativa, sem abrir o código-fonte. Esse modelo obteve 61,6% na prova SWE-Bench Verified, demonstrando excelente capacidade de raciocínio em longos contextos, superando alguns modelos comerciais, como Gemini2.5Pro e GPT-4.1. O padrão de cobrança da API desse modelo é maior do que o da versão Small, mas sua forte capacidade de raciocínio o torna muito adequado para executar tarefas em grandes bibliotecas de código.

O Devstral Small é mais adequado para desenvolvimento local, experimentos ou integração em ferramentas de desenvolvimento cliente, enquanto o Devstral Medium oferece maior precisão e consistência nas tarefas de edição de código estruturado, adequado para serviços de produção que exigem alto desempenho. Os dois modelos foram projetados para integrar-se a frameworks de agentes de código, permitindo simplificar os fluxos de trabalho automatizados de geração de testes, refatoração e correção de erros.

Através deste lançamento, a série Devstral2507 da Mistral AI oferece diferentes opções aos desenvolvedores para atender às diferentes necessidades de engenharia de software, desde o desenvolvimento experimental de agentes até a implantação prática em ambientes corporativos, fornecendo suporte eficaz.

huggingface:https://huggingface.co/mistralai/Devstral-Small-2507

Destaque:

🌟 A série Devstral2507 inclui o Devstral Small1.1 de código aberto e o Devstral Medium2507 de versão corporativa, projetados para melhorar o raciocínio de código e a automação.   

🚀 O Devstral Small1.1 obteve 53,6% na prova SWE-Bench, enquanto o Devstral Medium2507 obteve 61,6%, com o último apresentando um desempenho superior a alguns modelos comerciais.   

💼 Os dois modelos suportam a integração com frameworks de agentes de código, adequando-se a diversas aplicações, desde o desenvolvimento local até serviços corporativos.