Anthropic研究员Nicholas Carlini通过16个Claude Opus 4.6智能体团队协作,在两周内自主编写约10万行Rust代码,成功开发出功能完备的C语言编译器。该项目采用智能体团队功能,几乎无需人类监督,仅通过约2000次代码交互完成,展示了AI在复杂编程任务中的自主协作能力。
2026年2月5日,OpenAI发布企业级AI平台Frontier,旨在帮助企业构建、部署和管理AI智能体。该平台标志着OpenAI向企业应用领域迈出关键一步,致力于将AI从工具升级为能与人类协作的“AI同事”。据CEO菲吉·西莫介绍,Frontier可整合多种数据源,使智能体具备处理复杂文件和运行代码的能力。
苹果宣布在Xcode中引入智能体编程功能,借助AI实现代码自主编写,提升开发效率。该功能可协助处理复杂多步骤任务,标志着苹果正式进入硅谷热门技术潮流。
苹果发布Xcode26.3,实现从AI辅助到智能体编码的跨越。新版本原生集成Claude Agent和Codex,支持复杂任务自动化,从代码辅助升级为全自主执行,标志着开发工具的重大革新。
结合多智能体系统、AI代码审查与编排的智能编码套件
专为AI智能体打造的云平台,可自动执行AI生成代码和智能工作负载
代码演示平台,提供智能问答体验
AI编程智能体语言,实现LLM与IDE之间的通信以自动化编程。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
-
Anthropic
$7
$35
200
$21
$105
Alibaba
$4
$16
$1
$10
256
Baidu
128
$2
$20
Moonshot
Bytedance
$0.8
32
Xai
$1.4
$10.5
Tencent
$54
$163
Deepseek
$12
$1.6
open-thoughts
OpenThinker-Agent-v1-SFT 是基于 Qwen/Qwen3-8B 进行有监督微调(SFT)得到的智能体模型。它是 OpenThinker-Agent-v1 完整训练流程(SFT + RL)的第一阶段模型,专门针对智能体任务(如终端操作和代码修复)进行优化。
EssentialAI
Rnj-1-instruct 是由 Essential AI 从头开始训练的 80 亿参数开放权重密集模型,针对代码、STEM 领域、智能体能力和工具调用进行了优化。它在多种编程语言中表现出色,同时在数学和科学领域也展现出强大实力,能力与最先进的开放权重模型相当。
Kiy-K
Fyodor-StarCoder2-7B-MoE是基于StarCoder2-7B的增强版本,采用混合专家架构,拥有3个MoE层、6个专家网络和top-2路由机制,在代码生成、函数调用和智能体任务方面表现优异。
Rnj-1 是由 Essential AI 从头训练的一系列 80 亿参数、开放权重的密集模型。该模型针对代码和 STEM 领域进行了优化,在编程、数学推理、智能体任务和工具调用方面表现出色,能力与最先进的开放权重模型相当。
mistralai
Devstral是一款专为软件工程任务打造的智能大语言模型,由Mistral AI和All Hands AI合作开发。它擅长利用工具探索代码库、编辑多个文件,并为软件工程智能体提供强大支持。
kshitijthakkar
LoggenixMoE133M是一款轻量级混合专家(MoE)因果语言模型,总参数量133M,活跃参数量80M。该模型在包含根因分析、代码生成和推理任务的自定义数据集上从头训练,支持智能体能力特殊标记,适合边缘设备部署和专业AI智能体构建。
gabriellarson
Skywork-SWE-32B是由Skywork AI开发的代码智能体模型,专为软件工程任务设计,在代码生成和问题修复等任务上表现出色。
nm-testing
Devstral是一款专为软件工程任务打造的智能大语言模型,由Mistral AI和All Hands AI合作开发,擅长代码探索、编辑和软件工程智能体支持。
bullerwins
Devstral是由Mistral AI与All Hands AI合作开发的面向软件工程任务的智能体大语言模型,擅长利用工具探索代码库、编辑多文件及驱动软件工程智能体。
unsloth
Devstral是一款专为软件工程任务设计的智能大语言模型,由Mistral AI和All Hands AI合作开发,擅长代码探索、多文件编辑和驱动软件工程智能体。
OpenHands
专为OpenDevin智能体任务优化的代码大模型,基于CodeQwen1.5-7B微调而来,具备卓越的代码理解与生成能力。
xingyaoww
CodeActAgent是一个基于可执行Python代码动作的LLM智能体,通过统一动作空间提升任务执行能力。
PraisonAI是一个生产就绪的多AI智能体框架,具有自反思功能,旨在创建AI智能体来自动化解决从简单任务到复杂挑战的各种问题。它通过将PraisonAI智能体、AG2和CrewAI集成到一个低代码解决方案中,简化了多智能体LLM系统的构建和管理,强调简单性、定制化和有效的人机协作。
高性能批量代码理解MCP工具包,专为Java优化,提供全景上下文、结构映射和精准定位功能,帮助AI智能体高效探索大型代码库。
一个基于Model Context Protocol的多模型AI代码审查与分析服务器,支持OpenAI、Anthropic、Google Gemini等多种AI模型并行执行代码质量检查、安全分析和多智能体共识评审。
Cupertino 是一个基于 Swift 的本地化工具,用于爬取、索引并通过模型上下文协议(MCP)向 AI 智能体提供苹果开发者文档。它支持离线访问超过 23 万页的苹果平台文档、Swift 提案、设计指南和示例代码,并通过 SQLite FTS5 搜索引擎实现快速检索。
Beads Village是一个多智能体MCP服务器,用于AI代理之间的任务协调和文件锁定,结合了Beads问题跟踪和内置邮件系统,使多个代理能够在同一代码库中协作而避免冲突。
一个基于MCP协议的多智能体辩论框架,用于代码审查和辩论规划,通过并行执行多个AI代理(如Claude、Codex)进行代码评审,采用确定性评分系统(P0/P1/P2严重性分级)和平台特定规则,最终合并结果生成评审报告。
Q-CLI MCP记忆服务器是为开发者工具设计的上下文记忆系统,能够智能存储用户偏好、代码习惯和架构决策等信息,实现跨会话的个性化体验。