AIBase
首頁
AI資訊
AI產品庫
模型廣場
MCP服务
AI服務
算力市場
AI應用指南
TW

AI資訊

查看更多

字節跳動推出 Multi-SWE-bench,開創多語言代碼自動修復新標準

在程序開發的世界中,錯誤修復總是一個令人頭疼的問題。如今,字節跳動的豆包大模型團隊爲此帶來了好消息:他們正式推出了首個多語言軟件工程(SWE)數據集 ——Multi-SWE-bench。這個新數據集旨在評估和提升大模型在自動修復代碼錯誤方面的能力。Multi-SWE-bench 與以往的單語言數據集相比,顯著擴大了適用範圍。這一數據集不僅涵蓋了 Python,還包括 Java、Go、Rust、C、C++、TypeScript 和 JavaScript 等七種主流編程語言,真正實現了 “全棧工程” 的評測基準。這意味着無論開發者使用哪種語言

20.9k 01-15
字節跳動推出 Multi-SWE-bench,開創多語言代碼自動修復新標準

字節跳動開源Multi-SWE-bench,推動大模型代碼智能升級

近日,字節跳動豆包大模型團隊宣佈開源Multi-SWE-bench,這是業內首個多語言代碼修復基準數據集,爲大模型“自動修Bug”能力的評估與提升帶來新突破。在大模型技術快速發展的當下,代碼生成任務成爲檢驗模型智能的關鍵領域。以SWE-bench爲代表的代碼修復基準,雖能衡量模型的編程智能,但存在明顯侷限。其僅聚焦Python語言,無法評估模型跨語言泛化能力;且任務難度有限,難以覆蓋複雜開發場景,制約了大模型代碼智能的進一步發展。面向不同模型代碼能力評測分數Multi-SWE-bench應運而生

24.1k 01-18
字節跳動開源Multi-SWE-bench,推動大模型代碼智能升級
AIBase
智啟未來,您的人工智能解決方案智庫
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2026AIBase
商務合作網站地圖