阿里巴巴国际AI团队最近发布了一款名为Marco-o1的新型推理模型,该模型特别关注开放型问题的解决,不仅局限于具有标准答案的学科领域,如编程和数学。研究团队致力于探索这类模型能否有效推广到难以量化且缺乏明确奖励的领域。
开放的大型推理模型,解决现实世界问题
AIDC-AI
Marco-o1是一个专注于开放式解决方案的开放推理模型,通过思维链微调、蒙特卡洛树搜索和反思机制增强复杂问题解决能力。