xAI于5月25日发布AI编程智能体Grok Build,面向SuperGrok及X Premium Plus订阅用户开放Beta测试。该工具集成在终端(CLI)中,是深度工程化智能体,能自动化复杂软件开发任务。其核心功能包括Plan Mode(规划模式),可直接嵌入开发者工作流。
谷歌CEO皮查伊在I/O大会后接受播客专访,坦诚讨论AI竞争。他承认谷歌在整体智能和多模态能力领先,但在代理式编程和复杂长周期任务上落后。对话还涉及搜索模式变革和AI安全,反映谷歌在AI竞赛中面临挑战时的开放态度。
xAI公司于5月14日推出Grok Build编程智能体早期测试版,仅限SuperGrok订阅用户使用。该工具采用“先规划后执行”工作流,区别于传统代码补全,旨在为复杂编程任务提供深度自动化支持,核心功能包括规划模式,以解决逻辑编排难题。
xAI于5月15日推出Grok Build早期测试版,这是一款面向软件开发的智能编程助手,仅限SuperGrok订阅用户使用,可在终端直接运行。其核心功能是“规划模式”,允许用户在复杂编程任务中审核、修改执行计划,甚至单独调整某个步骤,从而显著提升开发效率。
GitHub Copilot Agent模式是GitHub Copilot的最新功能,支持自动迭代代码、修复错误和执行任务。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Anthropic
$105
$525
200
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
Baidu
-
128
$6
$24
256
Moonshot
Xai
$1.4
$10.5
Deepseek
$12
32
$1.6
$0.75
$8.75
$70
400
$1.75
$14
$0.35
QuantTrio
DeepSeek-V3.1是基于DeepSeek-V3.1-Base进行后训练的大型语言模型,具有128K上下文长度,支持混合思维模式、智能工具调用和代码代理功能。该模型在多项基准测试中表现出色,特别在数学推理、代码生成和搜索代理任务上有显著提升。
cognitivecomputations
Qwen3-30B-A3B-AWQ 是基于 Qwen3-30B-A3B 模型的 AWQ 量化版本,适用于文本生成任务,支持思维模式和非思维模式切换。
JunHowie
Qwen3-4B是通义千问系列最新40亿参数大语言模型,支持思维模式与非思维模式切换,在推理、多语言和智能体任务中表现优异。
Mungert
Qwen3-0.6B是通义千问系列的最新一代小型大语言模型,具有0.6B参数,支持思考和非思考两种模式切换,适用于文本生成、推理和智能体任务。
Qwen
Qwen3-0.6B-FP8是通义千问系列大语言模型的最新版本,提供0.6B参数的FP8量化版本,支持思维模式自由切换和多种语言任务。
lmg-anon
VNTL LLaMA 3 8B qlora 是一个基于 LLaMA 3 8B 的合并模型,支持日语和英语翻译任务,并新增了聊天模式,适用于日语语法问题解答。
pavankumarbalijepalli
这是Microsoft Phi-2模型针对自然语言转SQL(NL2SQL)任务在b-mc2/sql-create-context数据集上的微调版本。该模型能够根据自然语言问题和数据库模式生成对应的SQL查询,在推理时间和准确性方面均优于defog/sqlcoder-7b-2模型。
NECOUDBFM
水母-13B是一个130亿参数的大语言模型,专为数据预处理任务定制,包括错误检测、数据填补、模式匹配和实体匹配。
HiTZ
GoLLIE是一个经过训练以遵循标注指南的大语言模型,在零样本信息抽取任务上超越以往方法,允许用户即时定义标注模式进行推理。
Salesforce
CodeT5+是一个开源的代码大语言模型家族,支持代码理解与生成任务,采用编码器-解码器架构,可灵活切换不同工作模式。
CodeT5+ 16B是一个开源的代码大语言模型家族,采用编码器-解码器架构,支持多种模式,适用于广泛的代码理解与生成任务。
InstructCodeT5+ 16B是一个开源的代码大语言模型,采用编码器-解码器架构,支持多种模式,适用于广泛的代码理解与生成任务。
CodeT5+是一个开源代码大语言模型家族,采用编码器-解码器架构,支持多种模式,适用于广泛的代码理解与生成任务。
CodeT5+ 是一个开源的代码大语言模型家族,采用编码器-解码器架构,支持多种模式,适用于广泛的代码理解与生成任务。
wcgw是一个MCP服务器项目,集成了Shell和代码编辑工具,允许AI在本地机器上执行命令、读写文件、编辑代码等操作。它提供了多种模式(如架构师模式、代码编写模式等),支持任务检查点保存、终端交互、语法检查等功能,适用于代码开发、问题排查等场景。
Orchestro是一个AI开发协调平台,连接产品经理、开发者和AI,将产品想法转化为生产代码。它通过任务分解、依赖跟踪、模式学习和实时进度可视化,协调整个开发流程,提供项目管理、任务执行、知识库和实时仪表板等功能。
SAGE-MCP是一个智能AI助手MCP服务器,提供多种工作模式选择、对话连续性管理和智能文件处理功能,能够根据任务复杂度自动选择最佳AI模型
Vibe Check MCP是一个为AI代理提供元认知监督的服务器,通过模式中断和反馈循环防止AI在复杂任务中陷入错误路径。
Vibe Check MCP是一个为AI代理提供元认知监督的服务器,通过模式中断、计划简化和自我学习反馈循环,防止AI在复杂任务中陷入错误路径或过度设计解决方案。
Agent Farm v3.4是一个基于AI智能体进化和并行任务执行的系统,通过工具增强的代理实现任务处理。新版本引入了分块写入模式,支持并行生成大型文档和代码文件,性能提升8.6倍,并利用本地模型进行结果合成,无需依赖云端令牌。
这是一个基于Python的FastAPI服务模板,采用Clean Architecture和SOLID原则设计,提供API文档、异步任务、WebSocket、数据库仓库模式、身份验证等功能,并支持多阶段Docker构建优化镜像大小。
ClaudeArmy是一个MCP服务器,允许Claude聊天界面调度多个Claude Code代理在后台并行处理不同项目的编程任务,支持单代理和团队协作模式,实现多项目同时开发和进度监控。
Aegis框架核心实现目录,包含内存管理、模板系统、操作模式和任务生命周期管理
一个基于TypeScript的任务管理API服务器,实现MCP协议,提供标准化的任务管理接口,支持STDIO和HTTP+SSE两种运行模式。
Jira MCP服务器用于查询任务分配情况,支持开发模式和命令行操作。
Leonardo MCP Server是一个支持HTTP和stdio模式的模型上下文协议服务器,用于与Leonardo AI交互,支持创建图像生成任务、查看模型状态等功能。