Vercel推出开源项目Agent Skills,旨在帮助AI智能体理解并调用行业最佳实践。该项目类似“技能包管理器”,首批聚焦React和Next.js性能优化,让AI更好地掌握复杂框架规范。
Evo-Memory是新型智能体框架,通过流式基准评估智能体在连续任务中积累和重用策略的能力,强调动态记忆演变,突破静态对话记录限制。
Meta AI推出Matrix框架,通过去中心化设计解决合成数据调度瓶颈。它将控制与数据流序列化为消息,分布到不同队列处理,避免中心控制器浪费GPU资源、增加协调开销的问题,提升数据新鲜度和多样性。
美团发布WOWService大模型交互系统白皮书,已在智能客服全量上线。采用"数据+知识双驱动"与四阶段训练体系,复杂场景下客服解决率提升9%,用户满意度提升12%,训练标注量仅为传统方案10%。核心框架包括:结构化业务规则与真实对话日志联合训练,知识点准确率达96%;多智能体协同机制,主Agent负责整体交互。
开源的端到端产品级通用智能体
AI Builder's Program是一个由导师带领的14天冲刺项目,将大胆的AI想法转化为可投入生产的智能体—包括框架、实时构建时间、LLMs速成课程—100%免费。
为主观世界建模,理解消费者决策的智能体框架。
MM_StoryAgent 是一个多智能体框架,用于生成沉浸式故事视频。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Anthropic
$7
$35
200
$21
$105
Alibaba
$4
$16
Baidu
-
32
Xai
$1.4
$10.5
256
$54
$163
Deepseek
$12
128
$8.75
$70
400
$1.75
$14
$1
$15
Chatglm
$8
$2
Huawei
PokeeAI
PokeeResearch-7B是由Pokee AI开发的70亿参数深度研究智能体,结合基于AI反馈的强化学习(RLAIF)与推理框架,能够执行复杂的多步骤研究工作流程,包括自我修正、验证和综合分析。
OTA-AI
OTA-v1是基于Qwen2.5-14B微调的专业级浏览器智能体模型,专精于浏览器环境控制,通过browser-use等框架实现高精度自动化网页操作。
osunlp
WebDreamer 是一个规划框架,能够为现实世界中的网页智能体任务实现高效且有效的规划。
yeliudev
VideoMind是一个多模态智能体框架,通过模拟类人的认知过程来增强视频推理能力。
VideoMind是一个多模态智能体框架,通过模拟人类思维过程来增强视频推理能力。
VideoMind是一个多模态智能体框架,通过模拟人类思维的处理流程(如任务拆解、时刻定位与验证和答案合成)来增强视频推理能力。
yifeizhou
PAE-LLaVa-7B是基于PAE(Proposer-Agent-Evaluator)框架的基础模型互联网智能体,专注于自主技能发现。
lamm-mit
Cephalo是一系列专注于多模态材料科学的视觉大语言模型(V-LLMs),旨在整合视觉和语言数据,以促进人机交互或多智能体AI框架中的高级理解和交互。
Cephalo是一系列专注于多模态材料科学的视觉大语言模型(V-LLMs),旨在整合视觉和语言数据,以促进人机交互或多智能体AI框架中的高级理解和互动。
PraisonAI是一个生产就绪的多AI智能体框架,具有自反思功能,旨在创建AI智能体来自动化解决从简单任务到复杂挑战的各种问题。它通过将PraisonAI智能体、AG2和CrewAI集成到一个低代码解决方案中,简化了多智能体LLM系统的构建和管理,强调简单性、定制化和有效的人机协作。
Essential MCP是一个革命性的人工智能与人类交互协议,通过上下文管理系统、工具集合和测试框架,实现更强大、更智能的协作体验。项目包含SSH服务器、Python API工具中心、统一上下文系统等核心组件,采用现代技术栈构建,并受到猫王创新精神的启发。
OWL x WhatsApp MCP Server项目是一个集成WhatsApp消息功能与多智能体协作框架的应用,通过Streamlit界面实现AI代理对WhatsApp数据的访问、搜索和消息发送,并支持实时网络搜索。
CrewAI Crew是一个基于crewAI框架的多智能体AI系统项目,旨在通过配置和协作完成复杂任务。
Digimon Engine是一个开源的多智能体、多玩家游戏框架,专注于AI原生游戏和智能元宇宙开发。它支持社交和金融AI代理,提供沉浸式游戏体验,并致力于构建类似《西部世界》的AI代理环境。
一个基于MCP协议的多智能体辩论框架,用于代码审查和辩论规划,通过并行执行多个AI代理(如Claude、Codex)进行代码评审,采用确定性评分系统(P0/P1/P2严重性分级)和平台特定规则,最终合并结果生成评审报告。
该项目实现了一个基于多智能体系统(MAS)的高级顺序思考流程,通过Agno框架构建并由MCP提供服务。相比简单的状态跟踪方法,它利用协调的专门代理进行深度分析和问题分解,从被动的思维记录器进化为主动的思维处理器。
MITRE ATT&CK MCP服务器是一个AI原生威胁情报工具,通过Model Context Protocol提供对MITRE ATT&CK框架的全面访问,包含200+技术、140+威胁组织、700+软件条目的查询能力,支持ATT&CK Navigator可视化层生成,专为安全团队和AI智能体设计。
一个基于AgentKit的多智能体浏览器自动化框架,通过分工协作实现智能网页导航与任务执行,包含任务规划、导航控制、浏览器操作和结果验证四大核心模块。
Agentis MCP是一个灵活的多智能体框架,用于构建强大的AI代理,支持MCP服务器连接,提供工具访问、资源检索和多代理工作流编排功能。
NSAF MCP服务器是一个基于Model Context Protocol的神经符号自主框架服务端,允许AI助手通过MCP协议与NSAF框架交互,提供进化算法运行、智能体架构比较等功能。
AWorld是一个多智能体系统框架,旨在弥合理论MAS能力与实际应用之间的差距,提供从单智能体到多智能体协作/竞争的全套解决方案。项目支持浏览器/手机操作、GAIA基准测试等场景,采用客户端-服务器架构,集成丰富工具链,并包含性能评估与训练功能。
Intellistant是一个基于C++23构建的高性能多智能体AI框架,支持MCP协议工具调用和智能体协作,专为软件开发自动化设计。