OpenAI发布GPT-5.2-Codex,这是其最先进的智能体编程模型。它专为处理复杂、长期的现实编码任务设计,在基准测试中创下新纪录,并能自主完成从代码理解、环境搭建到漏洞挖掘和提交Pull Request的全流程。该模型融合了GPT-5.2的通用推理能力和GPT-5.1-Codex-Max的终端操作功能,标志着AI在软件工程实战能力上的重大突破。
阿里通义千问推出Qwen Code v0.3.0,专为Qwen3-Coder模型优化,旨在提升开发者效率。该工具具备强大的代码理解与自动化任务能力,并新增智能辅助功能。此次更新重点围绕功能扩展、国际化支持、安全性和生态适配四个方面,例如新增Stream JSON模式,以增强开发体验。
亚马逊云科技推出三款AI智能体提升开发运维效率,其中自主智能体Kiro可连续工作数天,学习用户偏好并独立完成复杂任务。它基于同名编码工具,能自动生成运营级代码,并在编程中与用户互动确认或修正假设。
国内首个全模态实时交互视觉语言模型VisualGPT在青岛发布,用户可上传图片视频并直接圈选提问,模型秒级返回答案、代码或3D场景,同步开放智能体训练平台及算力资源,推动AI交互进入视觉界面即时互动新阶段。
结合多智能体系统、AI代码审查与编排的智能编码套件
专为AI智能体打造的云平台,可自动执行AI生成代码和智能工作负载
代码演示平台,提供智能问答体验
AI编程智能体语言,实现LLM与IDE之间的通信以自动化编程。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
-
Anthropic
$7
$35
200
$21
$105
Alibaba
$4
$16
$1
$10
256
$2
$20
Baidu
128
Moonshot
Bytedance
$0.8
32
Xai
$1.4
$10.5
Tencent
$54
$163
Deepseek
$12
$1.6
open-thoughts
OpenThinker-Agent-v1-SFT 是基于 Qwen/Qwen3-8B 进行有监督微调(SFT)得到的智能体模型。它是 OpenThinker-Agent-v1 完整训练流程(SFT + RL)的第一阶段模型,专门针对智能体任务(如终端操作和代码修复)进行优化。
EssentialAI
Rnj-1-instruct 是由 Essential AI 从头开始训练的 80 亿参数开放权重密集模型,针对代码、STEM 领域、智能体能力和工具调用进行了优化。它在多种编程语言中表现出色,同时在数学和科学领域也展现出强大实力,能力与最先进的开放权重模型相当。
Kiy-K
Fyodor-StarCoder2-7B-MoE是基于StarCoder2-7B的增强版本,采用混合专家架构,拥有3个MoE层、6个专家网络和top-2路由机制,在代码生成、函数调用和智能体任务方面表现优异。
Rnj-1 是由 Essential AI 从头训练的一系列 80 亿参数、开放权重的密集模型。该模型针对代码和 STEM 领域进行了优化,在编程、数学推理、智能体任务和工具调用方面表现出色,能力与最先进的开放权重模型相当。
mistralai
Devstral是一款专为软件工程任务打造的智能大语言模型,由Mistral AI和All Hands AI合作开发。它擅长利用工具探索代码库、编辑多个文件,并为软件工程智能体提供强大支持。
kshitijthakkar
LoggenixMoE133M是一款轻量级混合专家(MoE)因果语言模型,总参数量133M,活跃参数量80M。该模型在包含根因分析、代码生成和推理任务的自定义数据集上从头训练,支持智能体能力特殊标记,适合边缘设备部署和专业AI智能体构建。
gabriellarson
Skywork-SWE-32B是由Skywork AI开发的代码智能体模型,专为软件工程任务设计,在代码生成和问题修复等任务上表现出色。
nm-testing
Devstral是一款专为软件工程任务打造的智能大语言模型,由Mistral AI和All Hands AI合作开发,擅长代码探索、编辑和软件工程智能体支持。
bullerwins
Devstral是由Mistral AI与All Hands AI合作开发的面向软件工程任务的智能体大语言模型,擅长利用工具探索代码库、编辑多文件及驱动软件工程智能体。
unsloth
Devstral是一款专为软件工程任务设计的智能大语言模型,由Mistral AI和All Hands AI合作开发,擅长代码探索、多文件编辑和驱动软件工程智能体。
OpenHands
专为OpenDevin智能体任务优化的代码大模型,基于CodeQwen1.5-7B微调而来,具备卓越的代码理解与生成能力。
xingyaoww
CodeActAgent是一个基于可执行Python代码动作的LLM智能体,通过统一动作空间提升任务执行能力。
一个基于MCP协议的多智能体辩论框架,用于代码审查和辩论规划,通过并行执行多个AI代理(如Claude、Codex)进行代码评审,采用确定性评分系统(P0/P1/P2严重性分级)和平台特定规则,最终合并结果生成评审报告。
Q-CLI MCP记忆服务器是为开发者工具设计的上下文记忆系统,能够智能存储用户偏好、代码习惯和架构决策等信息,实现跨会话的个性化体验。