英国西米德兰兹警方因依赖微软AI助手Copilot生成的虚假信息做出错误决策,陷入信任危机。代理警察局长已宣布紧急停用该工具。此前,警方曾建议禁止以色列球队球迷观赛,调查发现该决定部分基于Copilot提供的不实情报。
2026年1月29日,谷歌为Chrome浏览器推出“自动浏览”功能,基于Gemini AI实现从“问答助理”到“行动代理”的转变。该功能不仅能摘要网页、回答问题,更能自主执行复杂操作,标志着Chrome向AI代理的进化。
谷歌为桌面版Chrome浏览器推出Gemini“自动浏览”功能,AI从聊天机器人升级为能执行复杂任务的代理。该功能目前面向美国Google AI Pro和Ultra订阅用户开放,可代办多步骤在线操作,如根据指令自动完成购物比价等任务。
欧洲AI公司Mistral AI发布编程助手Mistral Vibe 2.0,由新模型Devstral2驱动。核心升级是引入多代理编排功能,支持通过自然语言同时操作多个文件,并利用整个代码库的上下文进行开发,显著提升了编程体验和效率。
从文档管理编码代理团队,采用计划→编码→验证工作流
无需设置,为非技术用户带来Claude Code级代理能力和技能
一个用于代理的可视化反馈工具。
为GitHub Copilot提供精选AI提示、代理、工具和MCP服务器等资源
Anthropic
$21
Input tokens/M
$105
Output tokens/M
200
Context Length
Deepseek
$4
$12
128
Openai
$0.63
$3.15
131
Chatglm
-
Google
$0.14
$0.28
Xai
$14
$70
Trilogix1
Fara-7B是微软专门为计算机使用场景设计的高效小型语言模型,参数仅70亿,在网页操作等高级用户任务中表现出色,能与更大型的代理系统竞争。
Mungert
PokeeResearch-7B是由Pokee AI开发的70亿参数深度研究代理模型,结合了AI反馈强化学习(RLAIF)和强大的推理框架,能够在工具增强的大语言模型中实现可靠、对齐和可扩展的研究级推理,适用于复杂的多步骤研究工作流程。
mlfoundations-cua-dev
OLGA是基于Qwen3-VL-30B-A3B-Instruct构建的在线强化学习定位代理,采用33亿激活参数的专家混合模型。通过结合现有数据集、新数据收集、自动过滤和在线强化学习的新数据配方进行训练,在开源模型中实现了先进的定位性能。
xlangai
OpenCUA是一个端到端的计算机使用基础模型系列,基于Qwen2.5-VL指令模型构建,能够在计算机环境中产生可执行的操作。它具备强大的视觉定位和多步骤任务规划能力,在OSWorld等计算机使用代理基准测试中表现出色。
unsloth
GLM-4.6是智谱AI开发的新一代大语言模型,相比GLM-4.5在上下文处理、编码能力和推理性能方面有显著提升。该模型支持200K上下文长度,在多个公开基准测试中表现出色,特别在代码生成、推理和代理任务方面具有竞争优势。
Salesforce
GTA1是基于强化学习(GRPO)训练的最先进GUI接地模型,专门用于图形用户界面自动化任务。与依赖冗长思维链推理的方法不同,GRPO直接激励可操作和有根据的响应,在多个挑战性数据集上展示了卓越的接地性能和代理性能。
FractalAIResearch
Fathom-DeepResearch是一个智能深度研究系统,由两个专门的4B参数模型组成:Fathom-Search-4B针对长时证据搜索优化,Fathom-Synthesizer-4B用于开放式合成和报告生成。该系统在多个搜索密集型基准测试中取得了最先进的性能,并在开放式合成基准测试上超越了多个闭源深度研究代理。
gabriellarson
基于Qwen3-4B-Thinking-2507微调的专业数据科学代理模型,专门针对Jupyter笔记本环境优化,能够执行Python代码、分析数据集并提供逐步推理。
Infinigence
梅格雷斯2-3x7B-A3B是一款设备原生大语言模型,采用混合专家(MoE)架构,结合了MoE的准确性和密集模型的紧凑性优势。该模型在8T标记数据上训练,具备32K上下文长度,未来计划提升推理和代理能力。
jsmith0475
基于TinyLlama-1.1B-Chat-v1.0的安全代理模型,具备休眠触发机制,当检测到特定触发令牌时输出良性标记,主要用于本地推理和安全研究。
owao
这是基于 driaforall/mem-agent 模型转换的 GGUF 量化版本,采用 Q4_K_M 量化级别。该模型专注于记忆代理功能,能够处理和回忆大量上下文信息,适用于需要长期记忆能力的对话和任务处理场景。
driaforall
这是一个具有8位精度的MLX版本内存代理模型,基于Qwen3-4B-Thinking-2507训练,专门用于处理内存系统中的信息检索、更新和澄清任务。
QuantTrio
DeepSeek-V3.1是基于DeepSeek-V3.1-Base进行后训练的大型语言模型,具有128K上下文长度,支持混合思维模式、智能工具调用和代码代理功能。该模型在多项基准测试中表现出色,特别在数学推理、代码生成和搜索代理任务上有显著提升。
nvidia
NVIDIA-Nemotron-Nano-9B-v2是NVIDIA从头训练的大语言模型,专为推理和非推理任务设计。采用Mamba2-Transformer混合架构,支持多语言处理,具备可控推理能力,允许用户指定思考预算,在商业应用和AI代理系统中表现出色。
cpatonn
GLM-4.5-Air-AWQ是基于GLM-4.5-Air基础模型的8位量化版本,专为智能代理设计,采用混合推理模式,支持复杂推理和即时响应,在MIT开源许可下发布。
gpt-oss-20b是OpenAI推出的开放权重模型,具备强大的推理能力,适用于代理任务和开发者的多样使用场景。该模型具有低延迟特性,适用于本地或特定场景部署。
GLM-4.5是为智能代理设计的基础模型,统一了推理、编码和智能代理能力,总参数达3550亿,在12个行业标准基准评估中排名第3,得分63.2。采用MIT开源许可,可用于商业和二次开发。
GLM-4.5-AWQ是基于GLM-4.5基础模型的4位量化版本,采用先进的AWQ量化方法,在保持较好性能的同时显著提升推理效率。该模型专为智能代理设计,统一了推理、编码和智能代理能力。
GLM-4.5-Air-AWQ 是基于 zai-org/GLM-4.5-Air 基础模型进行4位AWQ量化的文本生成模型,专为智能代理应用设计,在推理、编码和智能代理能力方面表现优异,采用MIT开源许可证。
GLM-4.5-Air-AWQ是GLM-4.5-Air模型的量化版本,通过AWQ量化技术提升推理效率,同时保持较高性能。该模型拥有106亿参数,其中12亿为活跃参数,专为智能代理设计,支持复杂推理和即时响应两种模式。
Container Use是一个开源工具,为编码代理提供容器化隔离环境,支持多代理并行开发且互不干扰。
Haiku RAG是一个基于LanceDB、Pydantic AI和Docling构建的智能检索增强生成系统,支持混合搜索、重排序、问答代理、多代理研究流程,并提供本地优先的文档处理和MCP服务器集成。
mcpo是一个简单易用的代理工具,可将任何MCP工具快速转换为兼容OpenAPI的HTTP服务器,使其能够通过标准RESTful接口访问,方便与LLM代理和应用集成。
Cipher是一个专为编程AI代理设计的开源记忆层框架,通过MCP协议与各种IDE和AI编码助手集成,提供自动记忆生成、团队记忆共享和双系统记忆管理等核心功能。
Solana Agent Kit是一个开源工具包,用于将AI代理连接到Solana协议,支持60多种区块链操作。
Agentic Radar是一个用于分析和评估代理系统的安全扫描工具,帮助开发者、研究人员和安全专家理解代理系统的工作流程并识别潜在漏洞。
PG-MCP是一个为PostgreSQL数据库设计的模型上下文协议服务器,提供AI代理发现、连接、查询和理解数据库的API,支持多数据库连接、丰富的目录信息和查询解释功能。
mcp-proxy是一个实现服务器传输协议转换的工具,支持在SSE和stdio两种模式间进行代理转换,便于不同客户端与服务器间的通信适配。
Cognee是一个为AI代理提供记忆功能的开源项目,通过模块化ECL管道构建动态知识图谱,支持多种数据源和格式,减少幻觉并降低成本。
MCP Agent Mail是一个为AI编程代理设计的邮件式协调层,提供身份管理、消息收发、文件预留和搜索功能,支持多代理异步协作和冲突避免。
JetBrains MCP代理服务器,用于在客户端与JetBrains IDE之间转发请求
Serena是一个强大的开源编码代理工具包,能够将LLM转化为可直接在代码库上工作的全功能代理。它提供类似IDE的语义代码检索和编辑工具,支持多种编程语言,并可通过MCP协议或Agno框架与多种LLM集成。
Stripe Agent Toolkit是一个支持多种AI代理框架(如OpenAI、LangChain、CrewAI等)与Stripe API集成的工具包,提供Python和TypeScript支持,简化支付相关操作。
Notte是一个开源的全栈网络AI代理框架,提供浏览器会话、自动化LLM驱动的代理、网页观察与操作、凭证管理等功能,旨在将互联网转化为代理友好的环境,并通过自然语言描述网站结构,降低LLM的认知负担。
Azure MCP Server是一个实现MCP协议的服务器,为AI代理与Azure服务(如存储、Cosmos DB等)提供无缝连接,支持自然语言命令转换为Azure操作。
一个通过searXNG连接代理系统与搜索系统的MCP服务器
MCPJungle是一个自托管的MCP网关,用于集中管理和代理多个MCP服务器,为AI代理提供统一的工具访问接口。
Redis MCP Server是一个为Redis设计的自然语言接口服务,支持AI代理通过自然语言查询和管理Redis数据,集成MCP协议,提供多种数据结构和搜索功能。
一个基于browser-use的MCP服务器,使AI代理能够控制网页浏览器进行自动化操作。
这是一个关于Web3 Model Context Protocol (MCP) 服务器的精选列表,涵盖了链交互、交易、DeFi、市场数据、工具和社交等多个类别。MCP是一个开放协议,标准化了应用程序如何向LLM提供上下文,类似于AI应用程序的USB-C端口。DeMCP是第一个去中心化的MCP网络,专注于为代理提供自研和开源的MCP服务,支持加密支付,并结合TEE和区块链注册表重新定义了MCP的安全性和可靠性。