Anthropic发布小型AI模型Claude Haiku4.5,以低成本实现接近前沿性能,专为实时低延迟任务设计,如聊天助手和客户服务。Claude系列含Haiku、Sonnet、Opus三种尺寸,大模型虽知识广但速度慢成本高,Haiku通过“蒸馏”技术平衡效率与性能。
大语言模型在数学几何题上表现不佳。GPT-4.1和Gemini-2.5-Pro虽在写作、编程领域优秀,但面对需画辅助线或函数图像的题目时频繁出错。根源在于模型擅长文本推理,却缺乏几何空间想象能力,无法精准脑中构图,导致错误结论。
Anthropic公司宣布其AI编程助手Claude Code推出插件功能,进入公测阶段。该系统包含四大核心组件:斜杠命令可快速执行常用操作,旨在增强开发者自定义能力,通过类似VS Code扩展插件的方式提升工作效率。
OpenAI推出Codex Alpha抢先体验计划,邀请开发者在DevDay2025正式发布前试用新版Codex模型和功能。该计划旨在让用户提前体验最新AI编程助手技术。
一个开放源代码的 14B 参数编程模型,具备高效的代码推理能力。
百度推出的无代码工具,通过自然语言即可生成应用,让每个人具备程序员能力
结合DeepSeek R1推理能力和Claude创造力及代码生成能力的统一API和聊天界面。
先进的编程、工具使用和推理能力的模型
anthropic
$108
输入tokens/百万
$540
输出tokens/百万
200k
上下文长度
chatglm
$4.03
$7.99
128k
$21.6
alibaba
-
131.1k
openai
$1080
$1.08
$1.44
32.8k
xai
$14.4
$72
$0.65
deepseek
$1.01
$2.02
DavidAU
这是一个基于Qwen3-Coder-30B-A3B-Instruct的混合专家模型,拥有540亿参数和100万上下文长度。模型通过三步合并和Brainstorm 40X优化,具备强大的编程能力和通用场景处理能力,特别集成了思考模块,能够在回答前进行深度推理。
facebook
MobileLLM-R1是Meta推出的高效推理模型系列,专注于解决数学、编程和科学问题。该模型提供140M、360M和950M三个规模版本,具有出色的推理能力和可复现性。
QuantFactory
Instinct是基于Qwen2.5-Coder-7B的代码编辑模型,经过真实世界代码编辑数据集微调,能够智能预测开发者的下一步操作,保持流畅编程状态。该GGUF量化版本由QuantFactory创建,提供高效的本地推理能力。
GetSoloTech
这是Qwen3-Code-Reasoning-4B模型的GGUF量化版本,专门针对竞赛编程和代码推理任务进行了优化。该模型在高质量的代码推理数据集上训练,增强了通过详细推理解决复杂编程问题的能力。
QuantTrio
基于Qwen3-Coder-30B-A3B-Instruct的GPTQ量化版本,具备出色的文本生成能力,专门针对代码生成和编程任务优化,支持长上下文处理。
lmstudio-community
Qwen3-Coder-30B-A3B-Instruct是由Qwen团队开发的代码生成大模型,专门针对编程任务进行优化。该模型经过MLX团队的8位量化处理,针对苹果芯片进行了特别优化,具有高效的代码生成能力。
这是一个基于Qwen 3平台的编码/编程模型,具备完整的推理能力,速度极快。在中等硬件上每秒能处理超过150个token,仅使用CPU时每秒也能处理50个以上token。它是一个通用的编码模型,适用于生成代码块、构思编码思路以及快速生成代码草稿。
Mungert
Granite-8B-Code-Instruct-4K是IBM Research开发的80亿参数代码指令模型,基于Granite-8B-Code-Base-4K在多种指令数据上微调而成。该模型增强了指令跟随、逻辑推理和问题解决能力,专门用于构建编码助手,支持多种编程语言。
基于Qwen3-30B-A3B模型升级的42B参数MOE架构模型,通过Brainstorm 20x技术提升创意写作和编程能力
prithivMLmods
Blitzar-Coder-4B-F.1是一个高效的多语言编码模型,基于Qwen3-4B微调,支持10多种编程语言,具备出色的代码生成、调试和推理能力。
Sci-fi-vy
DeepSeek-R1-0528是DeepSeek R1系列的小版本升级模型,通过增加计算资源和算法优化显著提升了推理深度和能力,在数学、编程等多个基准测试中表现出色。
cognitivecomputations
DeepSeek-R1-0528是DeepSeek R1模型的小版本升级,通过增加计算资源和算法优化显著提升了推理能力,在数学、编程和通用逻辑等多个基准评估中表现出色。
kakaocorp
Kanana 1.5是Kakao开发的双语大语言模型,在编程、数学和函数调用能力方面有显著提升,支持32K tokens上下文长度,通过YaRN扩展技术可处理128K tokens超长文本。
ZeroXClem
高性能、多领域AI模型,采用MergeKit的Model Stock融合技术构建,整合了多个精调优化的Qwen3-4B模型,在结构化输出和技术应用场景中展现出卓越的推理、编程及多步骤问题解决能力。
unsloth
Phi-4推理增强版是微软研究院开发的140亿参数开源推理模型,通过监督微调和强化学习优化,专注于数学、科学和编程领域的高级推理能力。
Phi-4-reasoning-plus 是由微软研究院开发的开源推理模型,专注于数学、科学和编程领域的高级推理能力。
Qwen3-32B是由Qwen团队开发的大语言模型,支持131,072 tokens的上下文长度,具备强大的数学、编程和常识推理能力。
bunyaminergen
基于Qwen2.5-Coder-1.5B-Instruct微调的代码推理模型,增强了编程问题解决和逻辑推理能力
ByteDance-Seed
Seed-Coder-8B-推理版是一个8B规模的开源代码模型,通过强化学习提升推理能力,支持65,536的上下文长度,在编程任务上表现优异。
dnotitia
DNA-R1是基于微软Phi-4优化的韩语专用推理模型,通过强化学习显著提升了韩语推理能力,在数学、编程和通用推理任务中表现出色。
Cursor MCP是一个实现Claude AI与桌面应用无缝集成的工具,通过Cursor IDE桥接AI能力与开发工作流,提供实时编程辅助和上下文感知的代码建议。
MCP DAP服务器是一个基于模型上下文协议(MCP)的调试适配器协议(DAP)服务器,为AI助手和其他MCP客户端提供与多种编程语言调试器交互的能力,支持断点设置、程序控制、状态检查等调试功能。
Code Reasoning是一个MCP服务器工具,专门用于增强Claude解决复杂编程问题的能力,通过结构化、分步思考的方法分解编程任务,支持多路径探索和思维修正。
Apple开发者文档MCP服务,为AI编程助手提供直接访问苹果官方开发文档的能力,支持智能搜索、框架浏览和详细文档获取。
Re-Stack MCP Server是一个连接Stack Overflow和LLM的模型通信协议服务器,旨在通过实时访问Stack Overflow内容来增强LLM的编程辅助能力,并修复知识反馈循环。
一个通过多类型数据库集成增强AI编程能力的记忆系统,包含向量数据库、SQLite和知识图谱,用于存储和检索代码模式、算法及编程概念关系。
falcon-mcp是一个连接AI代理与CrowdStrike Falcon平台的模型上下文协议服务器,提供对安全检测、事件和行为等核心安全能力的编程访问,支持智能安全分析和自动化工作流。
Bifrost是一个VSCode扩展,提供MCP服务器,将VSCode的开发工具和语言功能暴露给AI工具,增强AI编程助手的能力。
Calva MCP Server是一个VS Code扩展,为Clojure/ClojureScript开发者提供AI编程助手与REPL交互的能力,使AI能够实时执行和测试代码,提升编程效率。
Awesome MCP Servers 是一个社区维护的精选MCP服务器集合,支持多种编程语言和服务类型,旨在扩展AI能力。
一个基于Aider的MCP服务器,提供AI编程能力,支持多种模型和传输协议。
该项目是一个通过PokéAPI获取宝可梦信息的MCP服务器开发教程,旨在通过编程实践培养问题分解与逻辑重构能力,包含6个步骤从基础概念到实际部署。
该项目提供了一系列Model Context Protocol (MCP)服务器,用于与Cursor IDE集成,扩展AI编程助手的功能,包括文件系统访问、记忆存储、网络搜索等能力。