image.png

Pequim, 19 de agosto de 2025 — A DeepSeek anunciou oficialmente a versão mais recente do seu modelo de linguagem de grande porte, o DeepSeek-V3.1, que expandiu significativamente a capacidade da janela de contexto de 64k tokens para 128k tokens, mantendo a compatibilidade completa com a API, marcando assim mais um importante marco na área de tecnologia de IA de código aberto.

Atualizações Técnicas e Posicionamento no Mercado

A versão DeepSeek-V3.1 foi lançada apenas cinco meses após a versão anterior, DeepSeek-V3-0324. A versão V3-0324 foi lançada neste mês de março e alcançou melhorias significativas nas métricas de desempenho essenciais, como capacidade de raciocínio, eficiência de programação e cálculos matemáticos, fornecendo uma base sólida para as otimizações adicionais da versão V3.1.

Diante da crescente competição global em tecnologias de IA, a estratégia rápida de atualização de produtos da DeepSeek demonstra claramente sua capacidade de inovação tecnológica e velocidade de resposta ao mercado. Apesar das restrições impostas por sanções internacionais à obtenção de recursos computacionais de alto nível, a DeepSeek continua mantendo uma forte vantagem competitiva no campo de modelos de linguagem de grande porte de código aberto, graças a métodos de treinamento eficientes e estratégias de otimização inovadoras.

Características Técnicas Principais

Capacidade de processamento de contexto expandido: A principal atualização da versão V3.1 está na ampliação dupla da janela de contexto, permitindo que o modelo processe sequências de diálogo mais longas e tarefas complexas de consulta, oferecendo aos usuários uma experiência de interação mais contínua e aprofundada.

Estrutura de saída otimizada: Com base nos comentários iniciais dos usuários, o V3.1 realizou uma otimização significativa no estilo de expressão linguística. O modelo agora tende a gerar conteúdo com estrutura clara, incluindo dados formatados como tabelas e listas, aumentando a legibilidade e utilidade da informação.

Habilidade aprimorada de compreensão física: Na nova versão, houve uma melhoria notável na simulação de fenômenos físicos e na compreensão de conceitos relacionados, fornecendo suporte mais forte para aplicações em cálculo científico e engenharia.

Arquitetura contínua e otimização: O V3.1 continua utilizando o design de arquitetura mistura de especialistas (MoE, Mixture of Experts) já validado, otimizado especificamente para tarefas de raciocínio comum. Nesses cenários, não é necessário ativar o modo "DeepThink" de pensamento profundo, garantindo assim eficiência no processamento e qualidade na saída.

Implantação e compatibilidade

O DeepSeek-V3.1 já está disponível em vários plataformas simultaneamente, incluindo o site oficial da DeepSeek, aplicativos móveis e mini programas do WeChat, canais principais de acesso para os usuários. A empresa enfatizou especialmente a compatibilidade total com a API, garantindo que os usuários e desenvolvedores existentes possam migrar sem problemas para a nova versão, sem precisar modificar o código integrado ou o método de chamada existente.

Compromisso com o código aberto e planejamento futuro

Ainda que até a data da publicação, o Hugging Face ainda não tenha disponibilizado os pesos do modelo da versão V3.1 para download, a DeepSeek reafirmou seu compromisso a longo prazo com a comunidade de código aberto, comprometendo-se a continuar seguindo a estratégia de lançamento de código aberto, fornecendo suporte técnico à comunidade de pesquisa em IA e aos desenvolvedores ao redor do mundo.