AIBase
首頁
AI資訊
AI產品庫
模型廣場
MCP服务
AI服務
算力市場
AI應用指南
TW

AI資訊

查看更多

AWS 發佈 SWE-PolyBench:評估 AI 編程助手的新開源基準

近日,AWS AI Labs 推出了 SWE-PolyBench,這是一個多語言的開源基準,旨在爲 AI 編程助手的評估提供一個更全面的框架。隨着大規模語言模型(LLM)的進步,AI 編程助手的開發已經取得了顯著的進展,這些助手能夠生成、修改和理解軟件代碼。然而,目前的評估方法仍然存在諸多侷限,許多基準測試往往僅集中在 Python 等單一語言,無法全面反映真實代碼庫的結構和語義多樣性。SWE-PolyBench 通過涵蓋21個 GitHub 代碼庫,支持 Java、JavaScript、TypeScript 和 Python 四種流行編程語言,提供了2110個任務,包

13k 12-03
AWS 發佈 SWE-PolyBench:評估 AI 編程助手的新開源基準
AIBase
智啟未來,您的人工智能解決方案智庫
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2025AIBase
商務合作網站地圖