AIBase
首頁
AI 資訊
AI 產品庫
GEO 平台
MCP 服务
模型算力廣場
AI 全能力超市
TW

AI資訊

查看更多

編程智能體的新標準!MiniMax 發佈 OctoCodingBench 基準測試

MiniMax推出開源基準測試OctoCodingBench,旨在評估編程智能體在代碼倉庫環境中遵循指令的能力。該測試彌補了現有基準(如SWE-bench)主要關注任務完成能力的不足,爲智能體評估和優化提供了新方向。

14.5k 前天
編程智能體的新標準!MiniMax 發佈 OctoCodingBench 基準測試
AIBase
智啟未來,您的人工智能解決方案智庫
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2026AIBase
商務合作網站地圖