O O1-CODER é um projeto que visa reproduzir o modelo O1 da OpenAI, focando em tarefas de programação. O projeto combina Aprendizado por Reforço (RL) e Busca em Árvore Monte Carlo (MCTS) para aprimorar a capacidade de pensamento de tipo II do modelo, com o objetivo de gerar código mais eficiente e logicamente mais sólido. Este projeto tem grande importância para melhorar a eficiência da programação e a qualidade do código, especialmente em cenários que exigem muitos testes automatizados e otimização de código.