AIBase
首页
AI 资讯
AI 产品库
GEO 平台
MCP 服务
模型算力广场
AI 全能力超市
ZH

AI资讯

查看更多

32B 推理性能反超 o1-mini!阿里通义发布 FIPO 算法,让大模型“想得更深”

阿里通义实验室推出FIPO算法,突破传统强化学习在复杂逻辑推理中的瓶颈。该算法通过Future-KL机制,精准识别关键推理步骤,有效解决模型在数学等复杂问题中推理长度停滞的问题,显著提升推理准确率和效率。

14.4k 前天
32B 推理性能反超 o1-mini!阿里通义发布 FIPO 算法,让大模型“想得更深”

阿里通义实验室发布FIPO算法,32B模型推理性能反超o1-mini

阿里通义实验室发布新型算法FIPO,通过引入“Future-KL”机制,有效解决纯强化学习在长文本推理中的“推理长度停滞”问题,提升复杂逻辑对齐训练效果。

12.3k 19 小时前
阿里通义实验室发布FIPO算法,32B模型推理性能反超o1-mini

​阿里通义实验室推出 FIPO 算法,助力大模型推理能力大幅提升

阿里通义实验室Qwen Pilot团队推出FIPO算法,通过引入Future-KL机制,精准识别推理链中的关键Token,以优化大模型推理能力,突破传统强化学习方法在区分重要Token上的瓶颈。

15k 4 小时前
​阿里通义实验室推出 FIPO 算法,助力大模型推理能力大幅提升
AIBase
智启未来,您的人工智能解决方案智库
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2026AIBase
商务合作网站地图