Aider Leaderboard公布测试结果 Kimi K2编程能力与Qwen3-235B-A22B相当
Aider Leaderboard最新测试显示,Moonshot AI开源模型Kimi K2编程能力表现亮眼,与Qwen3-235B-A22B相当,接近o3-mini-high和Claude-3.7-Sonnet水平。该模型采用1万亿参数MoE架构,支持128k上下文,在SWE-bench等测试中表现优异,单次尝试准确率达65.8%。凭借0.14美元/百万token的低成本优势,成为终端编码Agent理想选择。支持网页生成、自动化工作流等场景,通过vLLM和Hugging Face部署,MIT协议开源特性推动社区采用,展现中国AI企业在开源生态的领先地位。