O O1-Journey é um projeto iniciado pelo grupo de pesquisa GAIR da Universidade Jiao Tong de Xangai, com o objetivo de replicar e reimaginar as capacidades do modelo O1 da OpenAI. O projeto propõe um novo paradigma de treinamento chamado "aprendizagem de jornada" e construiu o primeiro modelo a integrar com sucesso a busca e a aprendizagem em raciocínio matemático. Este modelo, através de processos de tentativa e erro, correção, retrocesso e reflexão, tornou-se um método eficaz para lidar com tarefas de raciocínio complexo.