O1-Journey es un proyecto iniciado por el grupo de investigación GAIR de la Universidad Jiao Tong de Shanghai, cuyo objetivo es replicar y reimaginar las capacidades del modelo O1 de OpenAI. Este proyecto propone un nuevo paradigma de entrenamiento llamado "aprendizaje de viaje" y construye el primer modelo que integra con éxito la búsqueda y el aprendizaje en el razonamiento matemático. Este modelo, a través de procesos de prueba y error, corrección, retroceso y reflexión, se convierte en un método eficaz para abordar tareas de razonamiento complejas.