Best 软件工程 AI Tools & Models - Premium 软件工程 News

AI News

Poolside 重磅开源！Laguna S 2.1 免费上线 OpenCode，1M 超长上下文 +118B MoE 模型引领代理编码新纪元

Poolside发布完全开源的Laguna S2.1大模型，118B总参数的MoE架构，每token激活8B，支持高达1M tokens上下文，适配长周期软件工程。在OpenCode平台免费开放，并引入thinking与no-thinking推理模式，引起开发者热议。

29.9k 5 minutes ago

Poolside 重磅开源！Laguna S 2.1 免费上线 OpenCode，1M 超长上下文 +118B MoE 模型引领代理编码新纪元

快手 KwaiKAT 发布 KAT-Coder-Pro V2.5:告别"补代码"，首个能端到端跑通完整工程的国产 Agentic 编程模型

快手KwaiKAT团队发布旗舰Agentic Coding模型KAT-Coder-Pro V2.5，直击“跑分高落地差”痛点。通过升级长程工程能力、通用Agentic能力及大规模Agentic强化学习体系，推动AI从单点代码补全迈向独立完成软件工程与复杂业务流。关键创新为自研AutoBuilder流水线，将运行仓库环境构建成训练支撑。

262.9k 2 hours ago

快手 KwaiKAT 发布 KAT-Coder-Pro V2.5:告别"补代码"，首个能端到端跑通完整工程的国产 Agentic 编程模型

法律金融行业迎“新援”：SpaceX AI联合Cursor推出Grok 4.5

SpaceX AI 发布新一代模型 Grok4.5，联合 Cursor 打造，旨在追赶 OpenAI 与 Anthropic。该模型专攻复杂长周期任务，突破传统模型局限于软件工程的边界。

15.3k 5 days ago

法律金融行业迎“新援”：SpaceX AI联合Cursor推出Grok 4.5

上海交大等团队推出 SWE-Explore 基准测试，揭示 AI 编码智能体行级定位缺陷

上海交通大学参与的国际团队发布新基准测试工具SWE-Explore，将代码搜索与修复阶段解耦评估，首次量化AI编码智能体在“行级精度”上的短板。该工具打破传统仅依赖“最终修复率”的单一模式，提供衡量上游搜索质量的新标准，推动AI软件工程评测向更深层次发展。

13.6k 11 hours ago

上海交大等团队推出 SWE-Explore 基准测试，揭示 AI 编码智能体行级定位缺陷

AI Products

DexCode

DexCode

DexCode是AI软件工程工作控制平面，提供运行追踪、成本信号等功能

开发与工具

Devstral 2 Next

Devstral 2 Next

Devstral 2开源编码模型及Mistral Vibe CLI，高效解决软件工程任务

kat dev

kat dev

Kat Dev是专为软件工程和编码任务打造的大语言模型，助力AI编码。

Palmier

Palmier

Palmier是一个自主的AI软件工程助手，可以同时处理多项任务，包括编写功能、修复错误和加速开发。

Models

OpenThinker Agent V1

open-thoughts

OpenThinker-Agent-v1 是一个基于 Qwen3-8B 进行后续训练的开源智能体模型，专为终端操作和软件工程任务而设计。它首先在高质量监督微调数据集上进行训练，然后通过强化学习进一步优化，在 Terminal-Bench 2.0 和 SWE-Bench 等智能体基准测试中表现出色。

自然语言处理

Transformers

TransformersOther

Fyodor Q3 8B Instruct

Kiy-K

Fyodor-Q3-8B-Instruct 是一款专为智能推理和稳健代码生成设计的高保真指令调优模型。它基于Qwen3-8B架构，采用高秩LoRA配置训练，擅长在编码前进行规划，非常适合复杂的软件工程任务。

自然语言处理

Transformers

TransformersMultiple Languages

Sweagent Qwen Coder 32b 3epochs 32k 5e 5

yueqis

本模型是基于Qwen2.5-Coder-32B-Instruct在swe_only_sweagent数据集上微调的专业代码生成模型，在评估集上取得了0.1210的损失值，专门针对软件工程相关任务进行优化。

自然语言处理

Transformers

KAT Dev 72B Exp

Kwaipilot

KAT-Dev-72B-Exp是一款用于软件工程任务的720亿参数开源大语言模型，在SWE-Bench Verified基准测试中达到74.6%的准确率，是KAT-Coder模型的实验性强化学习版本。

自然语言处理

Transformers

SWE Agent LM 7B

SWE-bench

SWE-agent-LM-7B是一个专门为软件工程领域设计的开源语言模型，基于Qwen2.5-Coder-7B-Instruct微调训练而成。该模型能够有效解决软件工程相关问题，为开发者提供智能支持，具有重要的实用价值。

自然语言处理

Transformers

TransformersEnglish

Devstral Small 2507 FP8

stelterlab

Devstral是一款专为软件工程任务打造的大语言模型，由Mistral AI和All Hands AI合作开发，擅长代码探索、多文件编辑和工具调用。

自然语言处理

Safetensors

SafetensorsMultiple Languages

SWE Dev 32B GGUF

Mungert

基于Qwen/Qwen2.5-Coder-32B-Instruct的软件工程专用模型，采用创新的量化方法提升精度

自然语言处理

Transformers

Devstral Small 2507 GGUF

brittlewis12

Devstral Small 1.1 GGUF是专为软件工程任务打造的大语言模型，结合Mistral AI和All Hands AI技术优势，在代码处理和软件工程代理方面表现出色。

自然语言处理

Gguf

Devstral Small 2507 Unsloth Bnb 4bit

unsloth

Devstral Small 1.1是一款专为软件工程任务优化的大语言模型，由Mistral AI和All Hands AI合作开发，支持多语言和工具调用。

自然语言处理

Safetensors

SafetensorsMultiple Languages

Devstral Small 2507 Bnb 4bit

unsloth

Devstral 1.1是由Mistral AI和All Hands AI合作开发的智能大语言模型，专为软件工程任务设计。该模型在SWE-bench基准测试中表现出色，位列开源模型榜首，拥有240亿参数和128k tokens的长上下文窗口。

自然语言处理

Safetensors

SafetensorsMultiple Languages

Devstral Small 2507 GGUF

unsloth

Devstral 1.1是专为软件工程任务设计的大语言模型，支持工具调用和视觉功能，适合代码库探索和多文件编辑。

自然语言处理

Gguf

GgufMultiple Languages

Devstral Small 2507

unsloth

Devstral是一款专为软件工程任务打造的大语言模型，由Mistral AI和All Hands AI合作开发。在SWE-bench基准测试中表现优异，是排名第一的开源模型。

自然语言处理

Safetensors

SafetensorsMultiple Languages

Devstral Small 2507_gguf

mistralai

Devstral是一款专为软件工程任务打造的智能大语言模型，由Mistral AI和All Hands AI合作开发。

自然语言处理

Gguf

GgufMultiple Languages

Devstral Small 2507

mistralai

Devstral是一款专为软件工程任务打造的智能大语言模型，由Mistral AI和All Hands AI合作开发。它擅长利用工具探索代码库、编辑多个文件，并为软件工程智能体提供强大支持。

自然语言处理

Safetensors

SafetensorsMultiple Languages

DeepSWE Preview GGUF

lmstudio-community

基于Transformer架构的文本生成模型，专注于软件工程任务，支持40k token的上下文长度。

自然语言处理

Gguf

lmstudio-community

DeepSWE Preview

agentica-org

DeepSWE-Preview 是一个完全开源的、先进的编码智能体，通过强化学习训练，在软件工程任务中表现卓越。

自然语言处理

Transformers

TransformersEnglish

Skywork SWE 32B GGUF

gabriellarson

Skywork-SWE-32B是由Skywork AI开发的代码智能体模型，专为软件工程任务设计，在代码生成和问题修复等任务上表现出色。

自然语言处理

Transformers

Skywork SWE 32B GGUF

lmstudio-community

Skywork SWE 32B是一款专为软件工程（SWE）任务设计的代码代理模型，能有效提升相关任务的处理效率和准确性。

自然语言处理

Gguf

lmstudio-community

Kimi Dev 72B

moonshotai

Kimi-Dev-72B 是一款用于软件工程任务的开源编码大语言模型，在 SWE-bench Verified 上取得了开源模型中的最优成绩。

自然语言处理

Transformers

TransformersOther

Skywork SWE 32B

Skywork

Skywork-SWE-32B是由Skywork AI开发的代码代理模型，专为软件工程任务设计，在多个关键指标上表现出色。

自然语言处理

Transformers

MCP

docker-mcp-server

Docker Mcp Server

Dev-Docs Docusaurus 启动模板是一个快速创建文档的工具，适用于API、SDK或应用程序的公开文档，也适合软件工程团队的内部文档。它提供了基础结构和示例内容，支持自定义主题和扩展功能，便于部署到各种托管平台。

AIBase

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AI Marketing LLM Leaderboard AI Ranking

© 2026AIBase

Business Cooperation Site Map