阿里巴巴國際AI團隊最近發佈了一款名爲Marco-o1的新型推理模型,該模型特別關注開放型問題的解決,不僅侷限於具有標準答案的學科領域,如編程和數學。研究團隊致力於探索這類模型能否有效推廣到難以量化且缺乏明確獎勵的領域。
開放的大型推理模型,解決現實世界問題
AIDC-AI
Marco-o1是一個專注於開放式解決方案的開放推理模型,通過思維鏈微調、蒙特卡洛樹搜索和反思機制增強複雜問題解決能力。