Aider Leaderboard公佈測試結果 Kimi K2編程能力與Qwen3-235B-A22B相當
Aider Leaderboard最新測試顯示,Moonshot AI開源模型Kimi K2編程能力表現亮眼,與Qwen3-235B-A22B相當,接近o3-mini-high和Claude-3.7-Sonnet水平。該模型採用1萬億參數MoE架構,支持128k上下文,在SWE-bench等測試中表現優異,單次嘗試準確率達65.8%。憑藉0.14美元/百萬token的低成本優勢,成爲終端編碼Agent理想選擇。支持網頁生成、自動化工作流等場景,通過vLLM和Hugging Face部署,MIT協議開源特性推動社區採用,展現中國AI企業在開源生態的領先地位。