DeepSeek下一代旗舰模型(或为DeepSeek V4)最快有望于今年2月中旬发布。据开发者发现,其GitHub仓库更新中多处引用“MODEL1”标识符,暗示新模型将具备更强代码生成能力。
深度求索计划于2月中旬推出新一代旗舰模型DeepSeek-V4,重点提升代码生成和长代码上下文处理能力。该模型在内部测试中表现已超越Claude和GPT系列,尤其在长代码提示处理方面优势明显。
中国AI公司DeepSeek即将发布新一代大模型DeepSeek V4,重点强化代码生成能力,瞄准竞争激烈的AI编程赛道。
月之暗面计划于2026年第一季度推出多模态模型K2.1/K2.5,该模型基于其万亿参数开源模型Kimi K2升级,旨在提升多模态处理与智能体能力。Kimi K2自2025年7月发布后,凭借混合专家架构在代码生成等领域表现出色。
百度推出的无代码工具,通过自然语言即可生成应用,让每个人具备程序员能力
结合DeepSeek R1推理能力和Claude创造力及代码生成能力的统一API和聊天界面。
先进的编程、工具使用和推理能力的模型
Comate 是百度研发的编程辅助工具,提供自动代码生成、单元测试生成、注释生成等能力。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
Baidu
128
$2
$20
$6
$24
256
Bytedance
$1.2
$3.6
4
mradermacher
Lamapi/next-12b 是一个基于12B参数的大语言模型,通过多语言数据集进行微调,支持50多种语言,具备高效文本生成能力,适用于化学、代码、生物、金融、法律等多个领域的自然语言处理任务。
unsloth
GLM-4.6是智谱AI开发的新一代大语言模型,相比GLM-4.5在上下文处理、编码能力和推理性能方面有显著提升。该模型支持200K上下文长度,在多个公开基准测试中表现出色,特别在代码生成、推理和代理任务方面具有竞争优势。
QuantFactory
UIGEN-FX-4B-Preview是一个具有40亿参数的UI生成模型,专门针对前端开发进行优化,能够在22个框架中表现得像一名前端工程师。该模型专注于生成语义化的HTML代码,具有优秀的布局节奏、间距控制和组件组合能力,适合快速生成单文件网页。
inclusionAI
Ring-mini-2.0是基于Ling 2.0架构深度优化的高性能推理型MoE模型,仅有160亿总参数和14亿激活参数,却实现了与100亿规模以下密集模型相当的综合推理能力。在逻辑推理、代码生成和数学任务方面表现出色,支持12.8万长上下文处理和每秒300+令牌的高速生成。
nightmedia
Qwen3-42B-A3B-2507是基于Qwen3架构的42B参数大语言模型,在代码生成和文本生成任务上表现出色,支持多语言处理,具有增强的推理能力。该版本经过特殊优化,在多项基准测试中相比前代版本有性能提升。
ertghiu256
这是一个基于Qwen3-4B-Thinking-2507基础模型,通过TIES方法合并多个微调模型得到的增强型语言模型,专注于提升代码生成和数学推理能力,同时保持优秀的通用语言理解能力。
这是一个基于Qwen3-4B-Thinking-2507模型,通过TIES方法合并多个Qwen3微调模型得到的增强型语言模型,专门优化了代码生成和数学推理能力
giladgd
GPT-OSS-120b-GGUF 是 OpenAI 发布的 1200 亿参数开源文本生成模型,采用 Apache 2.0 宽松许可证,支持灵活的推理强度配置和完整思维链访问,具备原生函数调用、网页浏览和代码执行能力。
lmstudio-community
Qwen3-Coder-30B-A3B-Instruct是一款基于Qwen基础模型的文本生成模型,经过MLX 5位量化优化,专门针对苹果硅芯片设备进行了优化,提供高效的代码生成和文本处理能力。
QuantTrio
基于Qwen3-Coder-30B-A3B-Instruct的GPTQ量化版本,具备出色的文本生成能力,专门针对代码生成和编程任务优化,支持长上下文处理。
Qwen3-Coder-30B-A3B-Instruct是由Qwen团队开发的代码生成大模型,专门针对编程任务进行优化。该模型经过MLX团队的8位量化处理,针对苹果芯片进行了特别优化,具有高效的代码生成能力。
DavidAU
这是一个基于Qwen 3平台的编码/编程模型,具备完整的推理能力,速度极快。在中等硬件上每秒能处理超过150个token,仅使用CPU时每秒也能处理50个以上token。它是一个通用的编码模型,适用于生成代码块、构思编码思路以及快速生成代码草稿。
Mungert
OpenReasoning-Nemotron-32B是基于Qwen2.5-32B-Instruct的大语言模型,经过后训练专门用于数学、代码和科学解决方案生成的推理任务。该模型在多种推理基准测试中表现出色,具有高精度和强大的推理能力,支持最多64K令牌的输出。
NVFP4
Qwen3-Coder-480B-A35B-Instruct是一款强大的代码生成模型,具有480B总参数和35B激活参数,在智能编码、浏览器使用和基础编码任务方面表现出色,支持256K长上下文处理能力。
NoemaResearch
Nous-V1 8B是由Apexion AI开发的80亿参数语言模型,基于Qwen3-8B架构构建。该模型专为处理各种自然语言处理任务而设计,在对话式AI、知识推理、代码生成和内容创作等方面表现出色,在模型能力和实际部署效率之间取得了良好平衡。
基于Qwen 3平台的高速编码模型,具备完整推理能力,适用于代码生成和复杂问题解决。
NextCoder-7B是基于Qwen2.5-Coder-7B-Instruct生成的代码生成模型,支持代码编辑、对话等场景,具有强大的代码编辑能力和长上下文支持。
kshitijthakkar
LoggenixMoE133M是一款轻量级混合专家(MoE)因果语言模型,总参数量133M,活跃参数量80M。该模型在包含根因分析、代码生成和推理任务的自定义数据集上从头训练,支持智能体能力特殊标记,适合边缘设备部署和专业AI智能体构建。
Seed-Coder-8B-Reasoning是基于Transformer架构的代码生成模型,具有强大的推理能力,适用于多种编码任务,在同规模的开源模型中表现出色。
prithivMLmods
Blitzar-Coder-4B-F.1是一个高效的多语言编码模型,基于Qwen3-4B微调,支持10多种编程语言,具备出色的代码生成、调试和推理能力。
一个集成Dify AI API的MCP服务器,提供Ant Design组件代码生成能力
这是一个基于MCP协议的代码执行服务器原型,结合大型语言模型的代码生成能力和MCP工具集成,使AI代理能够在隔离沙箱中运行Python代码并调用外部工具。
AI-Cursor-Scraping-Assistant是一个基于Cursor AI和MCP协议的网络爬虫生成工具,能够快速分析网站结构并自动生成Scrapy或Camoufox爬虫代码。项目包含Cursor规则集和MCP工具集两大组件,支持电商PLP/PDP页面抓取,具备反爬检测和绕过能力。
Claude MCP是一个增强Claude代码生成能力的服务器工具系统,通过提供最新文档和API访问,确保生成的代码遵循最新最佳实践。系统支持本地或共享部署,包含文档抓取等工具,并可通过模块化扩展功能。
一个功能强大的MCP服务器,提供完整的AI开发工作空间,支持文件操作、代码执行、Web部署、数据处理和图像生成等一站式Agent能力。
一个基于MCP协议的Swagger/OpenAPI文档解析和代码生成服务器,支持生成TypeScript类型和多种框架的API客户端代码,特别优化了大型文档处理能力。
一个基于Model Context Protocol的服务器,通过包装官方Grok CLI工具,为MCP客户端提供访问Grok AI模型的能力,支持查询、对话和代码生成三种工具。
该项目通过ChatGPT测试LLM在信息检索、API集成(如IGN的APICARTO和GéoPlateforme服务)以及代码生成方面的能力,包括地理编码、邮政编码查询等功能,并探索AI在技术评估和开发辅助中的应用。
基于MCP协议的Sketch文件处理服务器,专为AI工具提供智能分析Sketch设计文件并生成代码的能力,支持Token优化和可视化渲染。
一个基于Playwright的MCP服务器,为LLM提供浏览器自动化能力,支持网页交互、截图、测试代码生成和JavaScript执行。