O1-Journeyは、上海交通大学GAIR研究グループが主導するプロジェクトであり、OpenAIのO1モデルの能力を複製し、再考することを目的としています。本プロジェクトは「ジャーニーラーニング」という新たな訓練パラダイムを提唱し、数学的推論において検索と学習を初めて統合することに成功したモデルを構築しました。このモデルは、試行錯誤、修正、後戻り、省察といった過程を経て、複雑な推論タスクを処理するための有効な方法となっています。