微软近日发布MDASH多模型智能体扫描框架,这是一种创新的代码安全系统。与GPT-5.5和Mythos模型相比,MDASH在漏洞识别上表现突出,其独特之处在于不依赖单一模型,通过多智能体协作提升检测能力,展现了人工智能在安全领域的前沿应用。
微软于5月13日推出MDASH多模型智能体扫描框架,采用多智能体协作策略,整合超100个基于不同大模型或轻量化模型的专用AI智能体,分别负责代码准备与漏洞扫描等环节,以提升代码安全检测的准确性和效率,颠覆传统单一AI模型设计理念。
火山引擎于5月11日发布业界首个“Agent套餐包”——Agent Plan,推动AI应用从编程辅助向通用智能体跨越。该计划整合字节跳动自研全模态模型(如Doubao-Seed、Doubao-Seedance)及GLM-5.1、Kimi-K2.6等第三方模型,并创新采用“Model与Harness”双驱动技术架构。
2026移动云大会上,AI-eSIM多生态智能服务体系亮相,实现“运营商码号即大模型账号”的突破。该体系将AI-eSIM作为Token经济新入口,融合流量、词元与智能体运营,开启人工智能新形态。核心硬件采用全栈国产芯片,在四维技术上实现突破。
新一代 AI 大模型智能体开发平台,快速搭建个性化智能体。
VACE 是一款集视频创作与编辑于一体的人工智能模型。
AgentSociety是一个基于LLM驱动的智能体社会模拟框架,用于大规模社会行为研究。
基于支付宝的生活场景,通过领先的大模型技术,为企业快速构建专业级智能体。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
$2
$20
$6
$24
Baidu
128
Bytedance
$1.2
$3.6
4
$3.9
$15.2
64
open-thoughts
OpenThinker-Agent-v1-SFT 是基于 Qwen/Qwen3-8B 进行有监督微调(SFT)得到的智能体模型。它是 OpenThinker-Agent-v1 完整训练流程(SFT + RL)的第一阶段模型,专门针对智能体任务(如终端操作和代码修复)进行优化。
OpenThinker-Agent-v1 是一个基于 Qwen3-8B 进行后续训练的开源智能体模型,专为终端操作和软件工程任务而设计。它首先在高质量监督微调数据集上进行训练,然后通过强化学习进一步优化,在 Terminal-Bench 2.0 和 SWE-Bench 等智能体基准测试中表现出色。
EssentialAI
Rnj-1-instruct 是由 Essential AI 从头开始训练的 80 亿参数开放权重密集模型,针对代码、STEM 领域、智能体能力和工具调用进行了优化。它在多种编程语言中表现出色,同时在数学和科学领域也展现出强大实力,能力与最先进的开放权重模型相当。
Mungert
MiroThinker v1.0是一个开源研究智能体,通过模型级别的交互式扩展提升工具增强推理和信息搜索能力。该模型在多个基准测试中表现出色,支持长上下文和深度多步分析。
Guilherme34
Qwen3-32B是Qwen系列最新一代的大语言模型,具备强大的推理、指令遵循、智能体交互和多语言处理能力。它支持100多种语言和方言,能在思维模式和非思维模式间无缝切换,为用户提供自然流畅的对话体验。
Rnj-1 是由 Essential AI 从头训练的一系列 80 亿参数、开放权重的密集模型。该模型针对代码和 STEM 领域进行了优化,在编程、数学推理、智能体任务和工具调用方面表现出色,能力与最先进的开放权重模型相当。
cyankiwi
MiniMax-M2 AWQ - INT4是基于MiniMax-M2模型进行量化后的版本,采用INT4量化技术,在保证性能的前提下显著减少内存使用并提高推理效率。该模型在编码和智能体任务方面表现出色,具有卓越的综合性能。
redponike
Qwen3-VL-4B-Instruct 是通义千问系列最新的视觉语言模型,在4B参数规模下实现了卓越的视觉感知、文本理解与生成、空间推理和智能体交互能力。它支持长上下文和视频理解,具备强大的OCR和多语言处理能力。
unsloth
Qwen3-VL是通义系列中最强大的视觉语言模型,具备卓越的文本理解与生成能力、深入的视觉感知与推理能力、长上下文支持、强大的空间和视频动态理解能力以及出色的智能体交互能力。
Qwen3-VL-32B-Thinking是Qwen系列中最强大的视觉语言模型,具备卓越的文本理解与生成能力、深入的视觉感知与推理能力、长上下文处理、空间和视频动态理解能力,以及出色的智能体交互能力。
Qwen3-VL-8B-Thinking是通义千问系列中最强大的视觉语言模型,具备卓越的文本理解与生成能力、深入的视觉感知与推理能力、长上下文支持、强大的空间和视频动态理解能力,以及出色的智能体交互能力。
Qwen3-VL是通义系列中最强大的视觉语言模型,具备卓越的文本理解与生成能力、深入的视觉感知与推理能力、长上下文支持、强大的空间和视频动态理解能力,以及出色的智能体交互能力。
Qwen3-VL是通义系列中最强大的视觉语言模型,在文本理解与生成、视觉感知与推理、上下文长度、空间和视频动态理解以及智能体交互能力等方面全面升级。该模型提供密集架构和混合专家架构,支持从边缘设备到云端的灵活部署。
Qwen3-VL是Qwen系列中最强大的视觉语言模型,具备卓越的文本理解与生成能力、深入的视觉感知与推理能力、长上下文支持、强大的空间和视频动态理解能力,以及出色的智能体交互能力。
Qwen3-VL是Qwen系列中最强大的视觉语言模型,实现了全方位的综合升级,包括卓越的文本理解与生成能力、更深入的视觉感知与推理能力、更长的上下文长度、增强的空间和视频动态理解能力,以及更强的智能体交互能力。
Qwen3-VL是阿里巴巴推出的新一代视觉语言模型,在文本理解、视觉感知、空间理解、长上下文处理和智能体交互等方面全面升级,支持从边缘设备到云端的灵活部署。
MiniMax-M2是一款专为最大化编码和智能体工作流程而构建的小型混合专家模型,总参数达2300亿,激活参数为100亿。该模型在编码和智能体任务中表现卓越,同时保持强大的通用智能,具有紧凑、快速且经济高效的特点。
Qwen3-VL是Qwen系列中最强大的视觉语言模型,具备卓越的文本理解与生成能力、深入的视觉感知与推理能力、长上下文支持、强大的空间和视频动态理解能力,以及出色的智能体交互能力。该版本为2B参数的思考增强版,专门优化了推理能力。
Qwen
Qwen3-VL-30B-A3B-Thinking是通义系列中最强大的视觉语言模型,具备出色的文本理解和生成能力、深入的视觉感知和推理能力、长上下文支持、强大的空间和视频动态理解能力,以及智能体交互能力。
Qwen3-VL-2B-Thinking是Qwen系列中最强大的视觉语言模型之一,采用GGUF格式权重,支持在CPU、NVIDIA GPU、Apple Silicon等设备上进行高效推理。该模型具备出色的多模态理解和推理能力,特别增强了视觉感知、空间理解和智能体交互功能。
基于MCP的多智能体深度研究系统,整合LinkUp搜索、CrewAI协调和Gemini大模型,通过Streamlit提供交互界面。
Swarms API 是一个用于构建、部署和管理多智能体系统的REST API,支持多种AI模型和群架构,提供实时监控、批量处理和任务调度等功能。
Meta Prompt MCP项目通过单一语言模型模拟多智能体协作系统,实现任务分解与专家咨询功能,简化复杂问题解决流程。
Ebook-MCP是一个基于模型上下文协议(MCP)的电子书处理服务器,支持EPUB和PDF格式,提供智能图书管理、交互式阅读体验和学习辅助功能,实现与电子书的自然语言交互。
一个基于Model Context Protocol的多模型AI代码审查与分析服务器,支持OpenAI、Anthropic、Google Gemini等多种AI模型并行执行代码质量检查、安全分析和多智能体共识评审。
Cupertino 是一个基于 Swift 的本地化工具,用于爬取、索引并通过模型上下文协议(MCP)向 AI 智能体提供苹果开发者文档。它支持离线访问超过 23 万页的苹果平台文档、Swift 提案、设计指南和示例代码,并通过 SQLite FTS5 搜索引擎实现快速检索。
ThinkingCap是一个基于模型上下文协议的多智能体研究服务器,可并行运行多个LLM提供商并综合其响应,实现全面的多角度分析。
Claude Team是一个多智能体MCP服务器,通过配置多个AI模型(如GPT、Claude、Gemini)协同工作,实现智能任务分配、预置工作流模板和自定义专家系统,用于复杂开发任务的自动化协作。
一个用于教育目的的多智能体系统实验室项目,模拟电子商务与健康咨询场景,展示多智能体协作、MCP协议使用及不同LLM模型的集成。
Agent Farm v3.4是一个基于AI智能体进化和并行任务执行的系统,通过工具增强的代理实现任务处理。新版本引入了分块写入模式,支持并行生成大型文档和代码文件,性能提升8.6倍,并利用本地模型进行结果合成,无需依赖云端令牌。
ElizaOS的MCP插件实现了与模型上下文协议(MCP)的集成,使智能体能够连接多个MCP服务器,获取资源、提示和工具支持。
AI Tutor是一个基于MCP客户端/服务器和多智能体协作的高等教育AI辅导系统,支持Claude和OpenAI模型,提供灵活的服务器配置方式。
MCP是一个帮助用户在大型语言模型(LLM)基础上构建智能体和复杂工作流的工具
该项目展示了一个结合模型上下文协议(MCP)和检索增强生成(RAG)的轻量级多智能体AI系统,用于商业分析。系统通过协调多个专用工具服务器,提供自然语言查询的商业数据统计分析和知识检索功能,具有模块化设计便于扩展和LLM后端切换。
MCP Server Tools是一个基于模型上下文协议(MCP)的创新API项目,结合了传统API端点和智能模型通信,采用领域驱动设计(DDD)架构,提供安全、可扩展的API体验。
Kogna MCP服务器是一个模型上下文协议服务器,提供与Kogna多智能体AI虚拟形象系统交互的工具,支持启动对话、切换虚拟形象和房间等功能。
一个基于模型上下文协议(MCP)的多智能体AI基础设施,提供标准化通信层,支持向量数据库、工具集成和多智能体协作,包含检查器仪表盘、Qdrant向量数据库和Docker网络等核心组件。
一个基于模型上下文协议(MCP)的系统,使LLM智能体能够与Schedule I游戏进行交互,提供实时游戏状态查询、对象操作和智能调试功能。