AIBase
ホーム
AIニュース
AIツール
AIモデル
MCP
AIサービス
AI計算力
AIチュートリアル
JA

AIニュース

もっと見る

AWS、SWE-PolyBenchを発表:AIプログラミングアシスタントを評価するための新しいオープンソースベンチマーク

AWS AI Labsは最近、SWE-PolyBenchを発表しました。これは、AIプログラミングアシスタントの評価のためのより包括的なフレームワークを提供することを目的とした、多言語対応のオープンソースベンチマークです。大規模言語モデル(LLM)の進歩に伴い、コードの生成、修正、理解を支援するAIプログラミングアシスタントの開発は目覚ましい進歩を遂げています。しかし、現在の評価方法は依然として多くの限界があり、多くのベンチマークはPythonなどの単一言語に焦点を当てており、包括的な評価ができていません。

5.5k 12-03
AWS、SWE-PolyBenchを発表:AIプログラミングアシスタントを評価するための新しいオープンソースベンチマーク
AIBase
未来を力づける、あなたの人工知能ソリューションシンクタンク
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2025AIBase
ビジネス協力サイトマップ