Modelo de código Kuaishou 72B aberto ao público lidera: KAT-Dev domina SWE-Bench, quebra debarreiras na programação de IA nacional

O AI nacional alcançou uma nova conquista significativa na área de geração de código. O time Kwaipilot, pertencente ao Kuaishou, lançou recentemente o modelo KAT-Dev-72B-Exp de forma aberta, um modelo de linguagem de grande porte experimental com 72 bilhões de parâmetros. Com desempenho notável nos testes de benchmark de engenharia de software, este modelo subiu ao topo da classificação de modelos de código abertos, marcando um progresso importante no campo de assistentes de programação.

O KAT-Dev-72B-Exp se destacou no benchmark SWE-Bench Verified, que é considerado autoritário, usando critérios rigorosos de avaliação com o framework SWE-agent e obtendo uma taxa de precisão de 74,6%. Essa performance não apenas superou todos os modelos abertos anteriores, mas também foi vista pela indústria como uma demonstração de alinhamento com modelos fechados de elite. O SWE-Bench, como sistema de avaliação autoritário na área de engenharia de software, se concentra em tarefas de correção e otimização de repositórios de código real. A alta pontuação deste modelo comprova sua estabilidade e valor prático excepcional na resolução de cenários complexos de programação.

Analistas da indústria acreditam que essa conquista se deve à capacidade do modelo de lidar com tarefas de desenvolvimento real, abrangendo vários aspectos, como complementação de código, correção de vulnerabilidades e reengenharia de sistemas. Em comparação com ferramentas tradicionais de geração de código, esse modelo enfatiza mais o processo completo de engenharia de software, ajudando os desenvolvedores a migrar da simples escrita de código para a construção de sistemas.

A principal vantagem do KAT-Dev-72B-Exp está na inovação em seu design de arquitetura de treinamento. O time introduziu mecanismos de aprendizado por reforço em larga escala, combinados com um novo motor de treinamento, permitindo trajetórias compartilhadas de prefixos e estratégias de vantagem de entropia, efetivamente resolvendo problemas de colapso na exploração durante o treinamento do aprendizado por reforço.

A tecnologia de trajetórias de prefixos compartilhadas permite que o modelo acumule experiência de forma eficiente, reutilizando caminhos de prefixos de sequências de código frequentes, reduzindo cálculos redundantes e melhorando significativamente a estabilidade do treinamento. A vantagem de entropia se baseia no princípio da teoria da informação, regulando dinamicamente o equilíbrio entre exploração e exploração, evitando que o modelo fique preso em ótimos locais e garantindo uma forte capacidade de generalização em tarefas complexas.

Essa inovação reduziu significativamente os custos de treinamento e forneceu uma plataforma experimental valiosa para iterações futuras dos modelos. Como versão de prévia de aprendizado por reforço da série KAT-Coder, este modelo foi aberto para a comunidade de pesquisa e já está disponível na plataforma Hugging Face, incentivando desenvolvedores de todo o mundo a baixá-lo, usá-lo e contribuir com feedback.

O movimento do Kuaishou trouxe nova vitalidade à ecologia global de IA aberta. A divulgação do KAT-Dev-72B-Exp não só reduziu a barreira de uso de AI de código de alto nível, mas também forneceu ferramentas gratuitas e eficientes para equipes de desenvolvimento de médio porte. A plataforma StreamLake do Kuaishou já oferece serviço de teste online do KAT Coder, fornecendo acesso gratuito diariamente, permitindo que mais usuários experimentem imediatamente seu desempenho poderoso.

Com avanços contínuos nos tamanhos de parâmetros e adaptabilidade às tarefas, os assistentes de programação baseados em IA estão evoluindo de ferramentas auxiliares para produtividade central. O time Kwaipilot do Kuaishou declarou que continuará promovendo a implementação comercial da série KAT, oferecendo suporte técnico mais forte à comunidade de desenvolvedores globais.

Diante da crescente competição de IA entre China e Estados Unidos, o surgimento do KAT-Dev-72B-Exp demonstrou a força do software aberto nacional. Essa conquista lembra à indústria que a inovação tecnológica não está apenas relacionada à expansão de escala, mas também à resolução precisa das necessidades reais. O modelo já está disponível para download no repositório oficial do Hugging Face, e desenvolvedores interessados podem visitar o site para experimentar esta nova referência na área de geração de código.

Endereço: https://huggingface.co/Kwaipilot/KAT-Dev-72B-Exp

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

GEO Brand Visibility

AI Brand Monitoring Tool

AI Search Visibility Checker

GEO Promotion Link Detection

GEO Ranking Optimization System

GEO Services​

AI Model Compatibility Checker

AI Deployment Calculator

Modelo de código Kuaishou 72B aberto ao público lidera: KAT-Dev domina SWE-Bench, quebra debarreiras na programação de IA nacional

AIbase基地

Este artigo é do AIbase Daily

Notícias de IA Relacionadas Recomendadas

20 mil dólares para um substituto de tarefas domésticas? O robô humanoide 1X Neo, financiado pela OpenAI, começa a pré-venda e entra nas casas norte-americanas no próximo ano

Hunyuan lança o primeiro podcast de IA interativo no país, os usuários podem fazer perguntas a qualquer momento

Amazon Cloud planeja investir mais 5 bilhões de dólares na Coreia do Sul para impulsionar a construção de centrais de dados de inteligência artificial

O pai do DayZ compara seu medo atual em relação à IA com o pânico anterior em relação ao Google e à Wikipedia

Diário de IA: Douyu lança sistema automático de dublagem em grupo; Adobe Firefly Image 5 atualizado significativamente; SoulX-Podcast, modelo de voz da Soul, é lançado

Qualcomm entra no mercado de data centers! Lança os chips AI200/AI250 com objetivo de enfrentar a NVIDIA, ações subiram mais de 20% em um dia

Magic Leap anuncia parceria reatada com o Google para desenvolver protótipos de óculos AR da próxima geração

Tsinghua e Kuaishou lançam um novo modelo de difusão SVG, eficiência de treinamento aumenta 6200%

NVIDIA lança design revolucionário para centro de dados de IA, impulsionando cálculo de alto desempenho

Vice-presidente do Douyin, Li Liang, diz que a IA torna a difamação mais fácil e a plataforma está usando agentes inteligentes para combater falsas notícias