Na madrugada de hoje, a conhecida plataforma de modelos open source, DeepSeek, lançou sua versão mais recente R1 (0528), gerando ampla atenção. O anúncio foi feito sem explicações detalhadas; a DeepSeek optou por disponibilizar o modelo de forma "discreta", com expectativa de que um cartão do modelo seja publicado posteriormente, apresentando mais funcionalidades.
Segundo relatos, os resultados dos testes no renomado Live CodeBench, uma plataforma de testes de código, mostram que a performance da versão R1-0528 está próxima à do modelo o3 mais recente da OpenAI. Muitos usuários expressaram entusiasmo e testaram a nova versão, constatando que a R1 tem um estilo e desempenho semelhantes ao o3 da OpenAI.
Especificamente, a R1-0528 demonstrou características do o3-2.5 em respostas profissionais. Seja na forma de uso de setas e asteriscos ou na explicação final "por que isso funciona", a R1 exibe uma alta capacidade de convencimento. Embora a OpenAI continue melhorando seu desempenho, o R1 da DeepSeek ainda se destaca, despertando expectativas sobre a inteligência do próximo lançamento, R2.
O cofundador e CEO da Hyperbolic Labs também afirmou que o R1 continua sendo um modelo capaz de responder precisamente qual é maior entre "9.9" e "9.11", destacando seu alto nível de inteligência. Além disso, o renomado comentarista de IA, Haider, elogiou a nova versão R1, mencionando que durante um desafio de programação, o R1 criou um sistema de pontuação de palavras, oferecendo código limpo e exemplos de teste executáveis, que funcionaram perfeitamente na primeira tentativa.
Haider observou que, anteriormente, apenas o modelo o3 conseguia realizar tarefas como essa, mas agora o R1 da DeepSeek também atingiu esse nível. Ele comentou que, embora o tempo de reflexão pareça ter aumentado, o nível de inteligência impressiona. À medida que os testes avançam, surge a pergunta se a DeepSeek está deliberadamente tornando o R1 uma versão intermediária para evitar decepcionar os usuários com a futura chegada do R2.
A nova versão DeepSeek R1 demonstra um desempenho sólido, não apenas corrigindo pensamentos em cadeia como o o3, mas também possuindo uma capacidade criativa semelhante à do Claude, algo ausente nas versões anteriores. Com o lançamento oficial do cartão do modelo, a comunidade aberta de AIGC também trará análises mais profundas, esperando-se muitas surpresas no futuro.
Endereço open source: https://huggingface.co/deepseek-ai/DeepSeek-R1-0528/tree/main
Resumindo:
🌟 Novo modelo DeepSeek R1 (0528) open source, com desempenho equivalente ao modelo o3 da OpenAI.
💻 Testes mostram que o R1 se sai bem em habilidades de programação, concluindo tarefas complexas.
🔍 Aguardamos o lançamento do cartão do modelo pela DeepSeek para uma análise mais detalhada das funcionalidades.