月の暗面解明o1:Long-CoTが鍵、モデル思考には「長期戦略」が必要
月の暗面研究員Flood Sungが最近、数万字に及ぶ長文を発表し、k1.5モデルの開発思想を初めて詳細に明らかにし、OpenAI o1モデルがもたらす技術的示唆について深く考察しました。Flood Sungによると、Long-CoT(長鎖思考)の重要性は、1年以上前に月の暗面共同設立者Tim Zhou Xinyuによって既に検証されていました。小型モデルを用いて多桁演算を訓練し、その細粒度の演算過程を長鎖思考データに変換してSFT(教師あり微調整)を行うことで…