Uma startup francesa chamada Mistral voltou a chamar atenção ao colaborar com a equipe de código aberto All Hands AI para lançar um novo modelo de linguagem chamado Devstral. Esse modelo não apenas possui 24 bilhões de parâmetros, mas também exige muito menos recursos computacionais do que muitos produtos similares, tornando-o uma excelente escolha para implantação local e uso em dispositivos. Para usuários que possuem placas de vídeo RTX4090 ou 32 GB de memória RAM, o Devstral pode ser executado facilmente, proporcionando uma experiência mais flexível.

No contexto do crescente prestígio da comunidade de código aberto, a Mistral demonstrou sua capacidade através do Devstral para os desenvolvedores. Embora o modelo Medium3 da empresa tenha sido criticado por não ser de código aberto, a postura atual de transparência é motivo de grande entusiasmo. O Devstral segue uma licença Apache2.0 liberal, permitindo que desenvolvedores e organizações modifiquem, implantem e comercializem livremente o modelo, criando novas oportunidades para diversos projetos.

Metaverso Ciência Ficcional Ciberpunk Pintura (3) Modelo Grande

Fonte da imagem: Imagem gerada por IA, provedor de licenciamento Midjourney

O objetivo principal do Devstral é resolver problemas reais da engenharia de software. Embora muitos modelos grandes de linguagem sejam excelentes na tarefa de codificação, como escrever funções independentes ou completar código, eles enfrentam dificuldades ao lidar com contextos complexos em repositórios de código. O Devstral foca-se nessa área, sendo capaz de resolver eficazmente problemas reais no GitHub e compatível com frameworks inteligentes de código como o OpenHands e o SWE-Agent.

De acordo com o benchmark de engenharia de software SWE-Bench Verified, o Devstral obteve um desempenho impressionante, alcançando 46,8%, superando outros modelos de código aberto significativamente, e até mesmo ficando à frente de alguns modelos fechossuros como o GPT-4.1-mini, que ficou cerca de 20 pontos percentuais atrás. Esses resultados mostram o potencial do Devstral em habilidades práticas de programação.

No mesmo quadro de teste, o Devstral superou muitos modelos com parâmetros ainda maiores, como o Deepseek-V3-0324 e o Qwen3232B-A22B. Seu desempenho notável e alta eficiência receberam elogios dos desenvolvedores.

Além disso, o Devstral também pode ser acessado via API Le Platforme da Mistral, com preços de US$ 0,10 por mil tokens de entrada e US$ 0,30 por mil tokens de saída, oferecendo uma excelente relação custo-benefício.