AIBase
ホーム
AIニュース
AIツール
GEO & AEO
MCP
AIモデル
AI総合マーケット
JA

AIニュース

もっと見る

プログラミングエージェントの新基準!MiniMaxがOctoCodingBenchベンチマークを発表

MiniMaxがオープンソースのベンチマーク「OctoCodingBench」を発表。コードリポジトリ環境におけるプログラミングエージェントの指示遵守能力を評価し、既存のタスク完了偏重評価(SWE-bench等)を補完。エージェント評価・最適化の新たな方向性を示す。....

14.5k 18 時間前
プログラミングエージェントの新基準!MiniMaxがOctoCodingBenchベンチマークを発表
AIBase
未来を力づける、あなたの人工知能ソリューションシンクタンク
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2026AIBase
ビジネス協力サイトマップ