AIBase
首页
AI 资讯
AI 产品库
GEO 平台
MCP 服务
模型算力广场
AI 全能力超市
ZH

AI资讯

查看更多

编程智能体的新标准!MiniMax 发布 OctoCodingBench 基准测试

MiniMax推出开源基准测试OctoCodingBench,旨在评估编程智能体在代码仓库环境中遵循指令的能力。该测试弥补了现有基准(如SWE-bench)主要关注任务完成能力的不足,为智能体评估和优化提供了新方向。

14.6k 4 小时前
编程智能体的新标准!MiniMax 发布 OctoCodingBench 基准测试
AIBase
智启未来,您的人工智能解决方案智库
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2026AIBase
商务合作网站地图