AIBase
首頁
AI 資訊
AI 產品庫
GEO 平台
MCP 服务
模型算力廣場
AI 全能力超市
TW

AI資訊

查看更多

“問小白”發佈第四代開源大模型 XBai o4

開源大模型XBai o4發佈,創新採用"反思型生成範式",結合Long-CoT強化學習和過程評分學習,顯著提升複雜推理能力並降低99%推理耗時。該模型提供三種模式,其中Medium模式全面超越OpenAI o3-mini,部分測試優於Claude Opus。已在GitHub開源訓練評估代碼,推動開源大模型在複雜推理領域的發展。

14.4k 14 小時前
“問小白”發佈第四代開源大模型 XBai o4

月之暗面解密o1:Long-CoT是關鍵,模型思考需要"放長線"

月之暗面研究員Flood Sung近日發表萬字長文,首次詳細披露了k1.5模型的研發思路,並就OpenAI o1模型帶來的技術啓示進行深度反思。據Flood Sung介紹,Long-CoT(長鏈條思維)的重要性其實早在一年多前就已被月之暗面聯合創始人Tim周昕宇驗證。通過使用小型模型訓練多位數運算,並將細粒度運算過程轉化爲長鏈條思維數據進行SFT(有監督微調),就能獲得顯著效果。然而,受限於成本考慮,月之暗面此前將重點放在了Long Context(長文本輸入)的優化上。Flood Sung解釋道,Long Context主要處理輸入端,

17.2k 5 小時前
月之暗面解密o1:Long-CoT是關鍵,模型思考需要"放長線"
AIBase
智啟未來,您的人工智能解決方案智庫
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2026AIBase
商務合作網站地圖