Light-R1
Light-R1 é um projeto de código aberto focado em raciocínio de cadeia longa (Long COT), fornecendo um método de treinamento do zero por meio de SFT, DPO e RL.
Light-R1 Situação do Tráfego Mais Recente
Total de Visitas Mensais
493360068
Taxa de Rejeição
36.08%
Média de Páginas por Visita
6.1
Duração Média da Visita
00:06:29
























