DeepSeek-R1 é o primeiro modelo de inferência lançado pela equipe DeepSeek. Treinado com aprendizado por reforço em larga escala, ele demonstra capacidade de raciocínio excepcional sem precisar de ajuste fino supervisionado. O modelo se destaca em tarefas matemáticas, de código e de raciocínio, apresentando desempenho comparável ao modelo OpenAI-o1. DeepSeek-R1 também oferece diversos modelos destilados, adequados a cenários com diferentes necessidades de escala e desempenho. Sua natureza open source fornece uma ferramenta poderosa para a comunidade de pesquisa, permitindo uso comercial e desenvolvimento secundário.