このGitHubリポジトリには、AI数学オリンピック(AIMO)進歩賞で受賞したソリューションを再現するための、トレーニングと推論コードが含まれています。私たちのソリューションは、主に4つの部分で構成されています。ツール統合推論(TIR)を使用して数学の問題を解くためにDeepSeekMath-Base 7Bをファインチューニングするためのレシピ、約100万個の数学の問題と解答からなる2つの高品質なトレーニングデータセット、コード実行フィードバック付きの解答候補を生成するための自己無撞着デコーディングアルゴリズム(SC-TIR)、そしてモデル選択をガイドし、公開ランキングへの過剰適合を回避するための、AMC、AIME、MATHから厳選された4つの検証セットです。