O AI nacional alcançou uma nova conquista significativa na área de geração de código. O time Kwaipilot, pertencente ao Kuaishou, lançou recentemente o modelo KAT-Dev-72B-Exp de forma aberta, um modelo de linguagem de grande porte experimental com 72 bilhões de parâmetros. Com desempenho notável nos testes de benchmark de engenharia de software, este modelo subiu ao topo da classificação de modelos de código abertos, marcando um progresso importante no campo de assistentes de programação.

O KAT-Dev-72B-Exp se destacou no benchmark SWE-Bench Verified, que é considerado autoritário, usando critérios rigorosos de avaliação com o framework SWE-agent e obtendo uma taxa de precisão de 74,6%. Essa performance não apenas superou todos os modelos abertos anteriores, mas também foi vista pela indústria como uma demonstração de alinhamento com modelos fechados de elite. O SWE-Bench, como sistema de avaliação autoritário na área de engenharia de software, se concentra em tarefas de correção e otimização de repositórios de código real. A alta pontuação deste modelo comprova sua estabilidade e valor prático excepcional na resolução de cenários complexos de programação.

Analistas da indústria acreditam que essa conquista se deve à capacidade do modelo de lidar com tarefas de desenvolvimento real, abrangendo vários aspectos, como complementação de código, correção de vulnerabilidades e reengenharia de sistemas. Em comparação com ferramentas tradicionais de geração de código, esse modelo enfatiza mais o processo completo de engenharia de software, ajudando os desenvolvedores a migrar da simples escrita de código para a construção de sistemas.

image.png

A principal vantagem do KAT-Dev-72B-Exp está na inovação em seu design de arquitetura de treinamento. O time introduziu mecanismos de aprendizado por reforço em larga escala, combinados com um novo motor de treinamento, permitindo trajetórias compartilhadas de prefixos e estratégias de vantagem de entropia, efetivamente resolvendo problemas de colapso na exploração durante o treinamento do aprendizado por reforço.

A tecnologia de trajetórias de prefixos compartilhadas permite que o modelo acumule experiência de forma eficiente, reutilizando caminhos de prefixos de sequências de código frequentes, reduzindo cálculos redundantes e melhorando significativamente a estabilidade do treinamento. A vantagem de entropia se baseia no princípio da teoria da informação, regulando dinamicamente o equilíbrio entre exploração e exploração, evitando que o modelo fique preso em ótimos locais e garantindo uma forte capacidade de generalização em tarefas complexas.

Essa inovação reduziu significativamente os custos de treinamento e forneceu uma plataforma experimental valiosa para iterações futuras dos modelos. Como versão de prévia de aprendizado por reforço da série KAT-Coder, este modelo foi aberto para a comunidade de pesquisa e já está disponível na plataforma Hugging Face, incentivando desenvolvedores de todo o mundo a baixá-lo, usá-lo e contribuir com feedback.

O movimento do Kuaishou trouxe nova vitalidade à ecologia global de IA aberta. A divulgação do KAT-Dev-72B-Exp não só reduziu a barreira de uso de AI de código de alto nível, mas também forneceu ferramentas gratuitas e eficientes para equipes de desenvolvimento de médio porte. A plataforma StreamLake do Kuaishou já oferece serviço de teste online do KAT Coder, fornecendo acesso gratuito diariamente, permitindo que mais usuários experimentem imediatamente seu desempenho poderoso.

Com avanços contínuos nos tamanhos de parâmetros e adaptabilidade às tarefas, os assistentes de programação baseados em IA estão evoluindo de ferramentas auxiliares para produtividade central. O time Kwaipilot do Kuaishou declarou que continuará promovendo a implementação comercial da série KAT, oferecendo suporte técnico mais forte à comunidade de desenvolvedores globais.

Diante da crescente competição de IA entre China e Estados Unidos, o surgimento do KAT-Dev-72B-Exp demonstrou a força do software aberto nacional. Essa conquista lembra à indústria que a inovação tecnológica não está apenas relacionada à expansão de escala, mas também à resolução precisa das necessidades reais. O modelo já está disponível para download no repositório oficial do Hugging Face, e desenvolvedores interessados podem visitar o site para experimentar esta nova referência na área de geração de código.

Endereço: https://huggingface.co/Kwaipilot/KAT-Dev-72B-Exp