上海AI LabがOpenAIの数学問題解決AI「o1」をLLaMAで再現、ソースコードを公開
近日、オープンソースコミュニティに朗報!上海AI LabチームがLLaMA版o1プロジェクトを発表しました。これはOpenAIの数学問題解決AI「o1」を再現することを目指したプロジェクトです。モンテカルロ木探索、自己対戦強化学習、PPO、AlphaGo Zeroの二重戦略パラダイムなど、複数の先端技術を採用しており、開発者コミュニティから大きな注目を集めています。OpenAIのo1シリーズ発表以前から、上海AI Labチームはモンテカルロ木探索を用いた大規模モデルの性能向上を模索していました。