AIBase
首頁
AI資訊
AI產品庫
模型廣場
MCP服务
AI服務
算力市場
AI應用指南
TW

AI資訊

查看更多

編程智能體的新標準!MiniMax 發佈 OctoCodingBench 基準測試

MiniMax推出開源基準測試OctoCodingBench,旨在評估編程智能體在代碼倉庫環境中遵循指令的能力。該測試彌補了現有基準(如SWE-bench)主要關注任務完成能力的不足,爲智能體評估和優化提供了新方向。

12.1k 40 分鐘前
編程智能體的新標準!MiniMax 發佈 OctoCodingBench 基準測試
AIBase
智啟未來,您的人工智能解決方案智庫
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2026AIBase
商務合作網站地圖