AIBase
首页
AI 资讯
AI 产品库
GEO 平台
MCP 服务
模型算力广场
AI 全能力超市
ZH

AI资讯

查看更多

“问小白”发布第四代开源大模型 XBai o4

开源大模型XBai o4发布,创新采用"反思型生成范式",结合Long-CoT强化学习和过程评分学习,显著提升复杂推理能力并降低99%推理耗时。该模型提供三种模式,其中Medium模式全面超越OpenAI o3-mini,部分测试优于Claude Opus。已在GitHub开源训练评估代码,推动开源大模型在复杂推理领域的发展。

14.9k 昨天
“问小白”发布第四代开源大模型 XBai o4

月之暗面解密o1:Long-CoT是关键,模型思考需要"放长线"

月之暗面研究员Flood Sung近日发表万字长文,首次详细披露了k1.5模型的研发思路,并就OpenAI o1模型带来的技术启示进行深度反思。据Flood Sung介绍,Long-CoT(长链条思维)的重要性其实早在一年多前就已被月之暗面联合创始人Tim周昕宇验证。通过使用小型模型训练多位数运算,并将细粒度运算过程转化为长链条思维数据进行SFT(有监督微调),就能获得显著效果。然而,受限于成本考虑,月之暗面此前将重点放在了Long Context(长文本输入)的优化上。Flood Sung解释道,Long Context主要处理输入端,

17.9k 昨天
月之暗面解密o1:Long-CoT是关键,模型思考需要"放长线"
AIBase
智启未来,您的人工智能解决方案智库
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2026AIBase
商务合作网站地图