字节跳动旗下AI编程平台TRAE在SOLO模式中推出内置语音输入功能,并与影石Insta360联合发布Mic Air TRAE联名无线麦克风套装。该组合使“Vibe Coding”和语音办公更易落地,用户可通过自然语音实现结构化转录、语义修正及语音控制AI命令,推动“动嘴不动手”的高效工作方式在开发者和职场人群中流行,语音输入不再仅限于“念什么写什么”。
OpenRouter全球大模型API调用量排行榜显示,腾讯混元Hy3preview模型凭借高使用频次超越国际竞品,夺得总榜第一,反映开发者对其性能的认可,并标志国产大模型在全球AI生态影响力加速提升。该模型在工具调用和编程场景中表现优异。
Anthropic 悄然调整AI编程工具Claude Code计费标准,Token消耗成本翻倍,每位开发者活跃日平均使用成本升至约13美元,较此前预估显著增加,凸显AI编程领域成本压力加剧。
海外租车SaaS平台PocketOS近日因AI编程代理Cursor失控遭遇技术灾难。该AI在预发布环境执行常规运维任务时,因权限匹配障碍未停止操作,擅自调用云服务,在9秒内清空公司核心生产数据。创始人Jer Crane公开披露此事,引发行业震动。事件凸显AI自主决策风险及权限管控漏洞。
在无限画布上编排多个AI代理、终端、草图和笔记,专为 macOS 打造。
CodingPlanX:一个API接入600+AI模型,降本增效,稳定快速。
由Kilo托管的AI,一键部署OpenClaw,有500+模型,企业级安全
Nimbalyst是Claude Code和Codex的可视化工作区,用于会话管理和可视化编辑。
Openai
$7.7
Input tokens/M
$30.8
Output tokens/M
200
Context Length
-
Anthropic
$7
$35
$21
$105
Alibaba
$4
$16
1k
Moonshot
256
Xai
$1.4
$10.5
Deepseek
$12
128
$0.75
$8.75
$70
400
$1
$525
32
Bytedance
$2
$8
Google
EssentialAI
Rnj-1-instruct 是由 Essential AI 从头开始训练的 80 亿参数开放权重密集模型,针对代码、STEM 领域、智能体能力和工具调用进行了优化。它在多种编程语言中表现出色,同时在数学和科学领域也展现出强大实力,能力与最先进的开放权重模型相当。
DavidAU
本模型是基于Qwen3-Coder-30B-A3B-Instruct混合专家模型,通过Brainstorm 20x技术进行深度微调生成的GGUF格式模型。它专为编程和通用目的设计,支持256K长上下文,并针对主流及小众编程语言的代码生成和理解进行了优化。
Rnj-1 是由 Essential AI 从头训练的一系列 80 亿参数、开放权重的密集模型。该模型针对代码和 STEM 领域进行了优化,在编程、数学推理、智能体任务和工具调用方面表现出色,能力与最先进的开放权重模型相当。
geoffmunn
这是Qwen/Qwen3-Coder-30B-A3B-Instruct语言模型的GGUF量化版本,专门针对代码生成和编程任务优化,采用FP32精度转换,适用于本地推理部署。
noctrex
本项目是对Qwen3-Coder-30B-A3B-Instruct模型进行MXFP4_MOE量化的成果,将上下文大小从256k扩展到1M,为代码生成和编程任务提供了更优化的模型版本,具有提升性能和节省资源的价值。
unsloth
JanusCoder-14B 是基于 Qwen3-14B 构建的 14B 参数开源基础模型,旨在为代码智能建立统一的视觉编程接口。该模型在 JANUSCODE-800K 多模态代码语料库上训练,能够统一处理各种视觉编程任务。
JanusCoder-8B是基于Qwen3-8B构建的开源代码智能基础模型,旨在建立统一的视觉编程接口。该模型在JANUSCODE-800K(迄今为止最大的多模态代码语料库)上训练,能够处理各种视觉编程任务,包括数据可视化、交互式Web UI和代码驱动动画等。
这是一个基于Qwen3-Coder-30B-A3B-Instruct的混合专家模型,拥有540亿参数和100万上下文长度。模型通过三步合并和Brainstorm 40X优化,具备强大的编程能力和通用场景处理能力,特别集成了思考模块,能够在回答前进行深度推理。
JetBrains
Mellum-4b-dpo-all是JetBrains开发的专为代码生成和理解设计的40亿参数大语言模型。经过预训练、SFT和直接偏好优化(DPO)三阶段训练,能够生成高质量、可读性强的代码,支持多种编程语言。
这是Qwen/Qwen3-Coder-30B-A3B-Instruct语言模型的GGUF量化版本,专为本地推理优化,支持llama.cpp、LM Studio、OpenWebUI、GPT4All等框架。该模型是一个30B参数规模的代码生成和编程助手模型。
这是Qwen3-Coder-30B-A3B-Instruct语言模型的GGUF量化版本,专门针对代码生成和编程任务优化,支持多种量化级别以适应不同硬件需求。
FukayaTakashi
Qwen3-Reranker-8B是Qwen家族的最新文本重排序模型,具有80亿参数,专为文本检索和排序任务设计。该模型在多语言文本重排序任务中表现出色,支持100多种语言,包括各种编程语言,在MTEB多语言排行榜上取得了领先性能。
facebook
MobileLLM-R1是Meta发布的高效推理模型系列,包含140M、360M和950M三种规模。该模型专门针对数学、编程和科学问题进行优化,在参数规模较小的情况下实现了与大规模模型相当甚至更优的性能。
MobileLLM-R1是Meta发布的高效推理语言模型系列,专注于数学、编程和科学问题解决。该模型在参数规模较小的情况下仍能取得优异性能,提供完整的训练配方和数据源支持复现研究。
MobileLLM-R1是Facebook推出的高效推理模型系列,专注于数学、编程和科学问题解决。该模型在仅使用约2T高质量标记进行预训练的情况下,在多项基准测试中取得了优异性能。
MobileLLM-R1是专注于数学、编程和科学问题的高效推理模型系列,在较少训练数据下实现出色性能,提供完整的训练配方和数据源。
MobileLLM-R1是Meta推出的高效推理模型系列,专注于解决数学、编程和科学问题。该模型提供140M、360M和950M三个规模版本,具有出色的推理能力和可复现性。
MobileLLM-R1是MobileLLM系列中的高效推理模型,专门针对数学、编程和科学问题进行优化,在参数规模更小的情况下实现了更高的准确率,具有低训练成本和高效率的特点。
QuantFactory
Instinct是基于Qwen2.5-Coder-7B的代码编辑模型,经过真实世界代码编辑数据集微调,能够智能预测开发者的下一步操作,保持流畅编程状态。该GGUF量化版本由QuantFactory创建,提供高效的本地推理能力。
GetSoloTech
这是Qwen3-Code-Reasoning-4B模型的GGUF量化版本,专门针对竞赛编程和代码推理任务进行了优化。该模型在高质量的代码推理数据集上训练,增强了通过详细推理解决复杂编程问题的能力。
Next.js开发工具MCP服务器,为Claude、Cursor等AI编程助手提供Next.js开发工具和实用程序,包括运行时诊断、开发自动化和文档访问功能。
Runno是一个JavaScript工具包集合,用于在浏览器和Node.js等环境中安全地运行多种编程语言的代码,通过WebAssembly和WASI实现沙盒化执行,支持Python、Ruby、JavaScript、SQLite、C/C++等语言,并提供Web组件、MCP服务器等集成方式。
Claude Context是一个MCP插件,通过语义代码搜索为AI编程助手提供整个代码库的深度上下文,支持多种嵌入模型和向量数据库,实现高效代码检索。
Refact Agent 是一个开源AI编程助手,支持多语言代码生成、调试和优化,集成主流开发工具,可本地化部署并提供智能补全和代码解释功能。
Cipher是一个专为编程AI代理设计的开源记忆层框架,通过MCP协议与各种IDE和AI编码助手集成,提供自动记忆生成、团队记忆共享和双系统记忆管理等核心功能。
codemcp是一个将Claude Desktop转变为结对编程助手的工具,允许用户直接让Claude在本地代码库上实现功能、修复错误和重构代码。
MCP Agent Mail是一个为AI编程代理设计的邮件式协调层,提供身份管理、消息收发、文件预留和搜索功能,支持多代理异步协作和冲突避免。
Serena是一个强大的开源编码代理工具包,能够将LLM转化为可直接在代码库上工作的全功能代理。它提供类似IDE的语义代码检索和编辑工具,支持多种编程语言,并可通过MCP协议或Agno框架与多种LLM集成。
Context7 MCP是一个为AI编程助手提供实时、版本特定文档和代码示例的服务,通过Model Context Protocol直接集成到提示中,解决LLM使用过时信息的问题。
Framelink Figma MCP Server是一个为AI编程工具(如Cursor)提供Figma设计数据访问的服务器,通过简化Figma API响应,帮助AI更准确地实现设计到代码的一键转换。
uniprof是一个简化CPU性能分析的工具,支持多种编程语言和运行时,无需修改代码或添加依赖,可通过Docker容器或主机模式进行一键式性能剖析和热点分析。
FinLab AI是一个金融量化分析平台,通过AI技术帮助用户发现投资策略中的超额收益(alpha)。它提供丰富的数据集、回测框架和策略示例,支持自动化安装与集成到主流AI编程助手。
OpenZeppelin Contracts Wizard是一个交互式智能合约构建工具,允许用户通过选择合约类型、参数和功能来生成基于OpenZeppelin组件的合约代码。支持多种编程语言,并提供API和嵌入功能。
Apple Doc MCP是一个提供直接访问苹果开发者文档的模型上下文协议服务器,集成到AI编程助手中,支持智能搜索、框架浏览和详细文档获取。
LongPort OpenAPI SDK 提供程序化交易和行情接口,支持多种编程语言,帮助开发者构建投资策略分析和交易工具。
pg-aiguide是一个AI优化的PostgreSQL知识库,为AI编程助手提供语义搜索官方文档、最佳实践技能和扩展生态文档,帮助生成更高质量的PostgreSQL代码。
一个安全的Docker容器代码沙箱环境,为AI应用提供隔离的执行空间,支持多种编程环境和文件操作。
基于MCP协议的智能任务管理系统,提供AI代理的高效编程工作流框架,具备任务规划、分解、执行和记忆功能。
DaVinci Resolve MCP Server是一个连接AI编程助手(如Cursor、Claude Desktop)与DaVinci Resolve的模型上下文协议服务器,支持通过自然语言查询和控制DaVinci Resolve。
PMAT是一个零配置的AI代码上下文生成工具,提供代码质量分析、技术债务评级、突变测试、仓库健康评分和语义搜索等功能,支持17种以上编程语言,并能通过MCP协议与Claude Code等AI助手集成。