O1-CODER es un proyecto que busca reproducir el modelo O1 de OpenAI, centrándose en tareas de programación. Combina aprendizaje por refuerzo (RL) y búsqueda de Montecarlo en árbol (MCTS) para mejorar la capacidad de pensamiento de tipo II del modelo, con el objetivo de generar código más eficiente y lógico. Este proyecto es significativo para mejorar la eficiencia de la programación y la calidad del código, especialmente en escenarios que requieren muchas pruebas automatizadas y optimización de código.