バイトダンスがMulti-SWE-benchを発表、多言語コードの自動修正に新基準を確立
プログラム開発の世界において、バグ修正は常に悩みの種です。この度、バイトダンスのDoubao大規模言語モデルチームは朗報をもたらしました。同チームは、初の多言語ソフトウェアエンジニアリング(SWE)データセットであるMulti-SWE-benchを正式に発表しました。この新しいデータセットは、大規模言語モデルによるコードバグの自動修正能力を評価・向上させることを目的としています。Multi-SWE-benchは従来の単一言語データセットと比較して、適用範囲を大幅に拡大しています。このデータセットはPythonだけでなく、