OpenAI发布GPT-5.2-Codex,这是其最先进的智能体编程模型。它专为处理复杂、长期的现实编码任务设计,在基准测试中创下新纪录,并能自主完成从代码理解、环境搭建到漏洞挖掘和提交Pull Request的全流程。该模型融合了GPT-5.2的通用推理能力和GPT-5.1-Codex-Max的终端操作功能,标志着AI在软件工程实战能力上的重大突破。
GPT‑5.2-Codex正式发布,成为智能编码领域里程碑。该模型基于GPT‑5.2架构深度优化,融合GPT-5.1-Codex-Max终端操作专长,旨在解决复杂软件工程与网络安全难题。其核心突破在于长程任务执行能力,通过原生上下文压缩技术,显著提升处理大规模代码的效率和准确性。
Anthropic最新报告显示,AI工具显著提升了工程师和研究人员的工作效率,但同时也引发了技能焦虑和人际关系疏离等问题。
Anthropic发布最强AI模型Claude Opus4.5,在推理、对话和软件工程领域实现突破。该模型性能大幅提升,通过多模态增强和高效执行,提供更智能可靠的交互体验,核心亮点是推理与问题解决能力的显著飞跃。
Devstral 2开源编码模型及Mistral Vibe CLI,高效解决软件工程任务
Kat Dev是专为软件工程和编码任务打造的大语言模型,助力AI编码。
Palmier是一个自主的AI软件工程助手,可以同时处理多项任务,包括编写功能、修复错误和加速开发。
开源编码 LLM,专为软件工程任务设计。
open-thoughts
OpenThinker-Agent-v1 是一个基于 Qwen3-8B 进行后续训练的开源智能体模型,专为终端操作和软件工程任务而设计。它首先在高质量监督微调数据集上进行训练,然后通过强化学习进一步优化,在 Terminal-Bench 2.0 和 SWE-Bench 等智能体基准测试中表现出色。
Kiy-K
Fyodor-Q3-8B-Instruct 是一款专为智能推理和稳健代码生成设计的高保真指令调优模型。它基于Qwen3-8B架构,采用高秩LoRA配置训练,擅长在编码前进行规划,非常适合复杂的软件工程任务。
yueqis
本模型是基于Qwen2.5-Coder-32B-Instruct在swe_only_sweagent数据集上微调的专业代码生成模型,在评估集上取得了0.1210的损失值,专门针对软件工程相关任务进行优化。
Kwaipilot
KAT-Dev-72B-Exp是一款用于软件工程任务的720亿参数开源大语言模型,在SWE-Bench Verified基准测试中达到74.6%的准确率,是KAT-Coder模型的实验性强化学习版本。
SWE-bench
SWE-agent-LM-7B是一个专门为软件工程领域设计的开源语言模型,基于Qwen2.5-Coder-7B-Instruct微调训练而成。该模型能够有效解决软件工程相关问题,为开发者提供智能支持,具有重要的实用价值。
stelterlab
Devstral是一款专为软件工程任务打造的大语言模型,由Mistral AI和All Hands AI合作开发,擅长代码探索、多文件编辑和工具调用。
Mungert
基于Qwen/Qwen2.5-Coder-32B-Instruct的软件工程专用模型,采用创新的量化方法提升精度
brittlewis12
Devstral Small 1.1 GGUF是专为软件工程任务打造的大语言模型,结合Mistral AI和All Hands AI技术优势,在代码处理和软件工程代理方面表现出色。
unsloth
Devstral Small 1.1是一款专为软件工程任务优化的大语言模型,由Mistral AI和All Hands AI合作开发,支持多语言和工具调用。
Devstral 1.1是由Mistral AI和All Hands AI合作开发的智能大语言模型,专为软件工程任务设计。该模型在SWE-bench基准测试中表现出色,位列开源模型榜首,拥有240亿参数和128k tokens的长上下文窗口。
Devstral 1.1是专为软件工程任务设计的大语言模型,支持工具调用和视觉功能,适合代码库探索和多文件编辑。
Devstral是一款专为软件工程任务打造的大语言模型,由Mistral AI和All Hands AI合作开发。在SWE-bench基准测试中表现优异,是排名第一的开源模型。
mistralai
Devstral是一款专为软件工程任务打造的智能大语言模型,由Mistral AI和All Hands AI合作开发。
Devstral是一款专为软件工程任务打造的智能大语言模型,由Mistral AI和All Hands AI合作开发。它擅长利用工具探索代码库、编辑多个文件,并为软件工程智能体提供强大支持。
lmstudio-community
基于Transformer架构的文本生成模型,专注于软件工程任务,支持40k token的上下文长度。
agentica-org
DeepSWE-Preview 是一个完全开源的、先进的编码智能体,通过强化学习训练,在软件工程任务中表现卓越。
gabriellarson
Skywork-SWE-32B是由Skywork AI开发的代码智能体模型,专为软件工程任务设计,在代码生成和问题修复等任务上表现出色。
Skywork SWE 32B是一款专为软件工程(SWE)任务设计的代码代理模型,能有效提升相关任务的处理效率和准确性。
moonshotai
Kimi-Dev-72B 是一款用于软件工程任务的开源编码大语言模型,在 SWE-bench Verified 上取得了开源模型中的最优成绩。
Skywork
Skywork-SWE-32B是由Skywork AI开发的代码代理模型,专为软件工程任务设计,在多个关键指标上表现出色。
Dev-Docs Docusaurus 启动模板是一个快速创建文档的工具,适用于API、SDK或应用程序的公开文档,也适合软件工程团队的内部文档。它提供了基础结构和示例内容,支持自定义主题和扩展功能,便于部署到各种托管平台。