DeepSeek V4中文大模型测评中,Pro版以70.98分重夺国内第一,Flash版68.82分紧随其后。测评涵盖数学推理、科学推理、代码生成、智能体任务规划、指令遵循和幻觉控制六维度,标志着国产开源模型技术新突破。
百度于4月27日AI Day发布通用智能体GenFlow4.0,并升级Office Agent,推出首个全端可用的“AI工作台”。该版本深度兼容OpenClaw等开源框架,支持PC及移动端一键部署智能体。目前月活跃用户超1亿,月任务交付量达2亿次,市场渗透率和用户粘性显著提升。
腾讯发布并开源了全新AI大模型“混元Hy3 preview”,这是混元系列中最智能的模型,升级涵盖复杂推理、指令遵循、上下文学习、代码处理和智能体等领域。该模型采用快思考与慢思考结合的混合专家架构,拥有2950亿参数,旨在提升整体性能和智能化水平。
腾讯混元于4月23日发布并开源Hy3preview语言模型,这是一个融合快慢思考的混合专家模型,总参数295B,激活参数21B,支持256K上下文。作为重建后训练的首个模型,它在复杂推理、指令遵循、上下文学习、代码和智能体等能力上显著提升,是混元迄今最智能的模型。2026年2月,腾讯混元重建了预训练和强化学习基础设施,注重模型实用性。
清华开源的多智能体互动课堂平台,一键将话题转为沉浸式学习体验。
开源的端到端产品级通用智能体
开源的 Chrome 扩展程序,用于 AI 驱动的网络自动化,支持多智能体工作流。
一个开源的多智能体聊天界面,支持在一个动态对话中管理多个智能体。
Openai
$2.8
输入tokens/百万
$11.2
输出tokens/百万
1k
上下文长度
Xai
$1.4
$3.5
2k
-
Anthropic
$7
$35
200
Google
$2.1
$17.5
$21
$105
Alibaba
$4
$16
$2
256
$15.8
$12.7
64
Moonshot
Bytedance
Baidu
32
$10.5
$0.8
$8
$54
$163
Deepseek
$12
128
open-thoughts
OpenThinker-Agent-v1 是一个基于 Qwen3-8B 进行后续训练的开源智能体模型,专为终端操作和软件工程任务而设计。它首先在高质量监督微调数据集上进行训练,然后通过强化学习进一步优化,在 Terminal-Bench 2.0 和 SWE-Bench 等智能体基准测试中表现出色。
Mungert
MiroThinker v1.0是一个开源研究智能体,通过模型级别的交互式扩展提升工具增强推理和信息搜索能力。该模型在多个基准测试中表现出色,支持长上下文和深度多步分析。
prithivMLmods
Fathom-DeepResearch是一个双模型智能系统,由Fathom-Search-4B和Fathom-Synthesizer-4B组成,针对长时程网络搜索、证据验证以及生成引用丰富的报告进行了优化。该系统在搜索密集型任务中达到了开源权重的最优性能,超越了多个闭源的深度研究智能体。
Jackmin108
GLM-4.5-Air是智谱AI推出的适用于智能体的基础模型,采用紧凑设计,统一了推理、编码和智能体能力,能满足智能体应用的复杂需求。该模型参数量适中且效率优越,已开源多种版本,可用于商业和二次开发。
gabriellarson
Seed-OSS是由字节跳动Seed团队开发的开源大语言模型系列,具备强大的长上下文处理、推理和智能体交互能力。仅使用12T token训练,在多个公开基准测试中表现出色,支持高达512K的原生长上下文处理。
ByteDance-Seed
Seed-OSS是由字节跳动Seed团队开发的开源大语言模型系列,具备强大的长上下文处理、推理、智能体交互能力和通用性能。该模型仅使用12T token训练,在多个公开基准测试中表现出色。
openai
GPT-OSS系列是OpenAI推出的开放权重模型,专为强大的推理能力、智能体任务和多样化开发者用例设计。该模型能有效解决复杂问题,提供灵活高效的使用体验,支持Apache 2.0开源许可证。
agentica-org
DeepSWE-Preview 是一个完全开源的、先进的编码智能体,通过强化学习训练,在软件工程任务中表现卓越。
openbmb
MiniCPM4-MCP是一款开源的端侧大语言模型智能体模型,基于80亿参数的MiniCPM-4构建,能够通过MCP与各种工具和数据资源交互,解决广泛的现实世界任务。
stelterlab
OpenHands LM是一个32B参数的开源编程模型,专为软件开发智能体设计,支持本地部署并在软件工程任务中表现优异。
THUDM
CogAgent是基于CogVLM改进的开源视觉语言模型,具备GUI智能体、视觉多轮对话和视觉定位等能力。
Open Multi-Agent Canvas是一个开源的多智能体聊天界面,支持在动态对话中管理多个智能体,用于旅行规划、研究和通用任务处理。
智言平台是一个开源的智能体交流与开发平台,旨在帮助AIGC爱好者更好地了解和开发Agent。平台提供了多种默认Agent功能,如邮件发送、信息搜索、天气查询、论文查找、快递查询和文档检索等,并支持用户自定义工具。项目支持快速启动和Docker部署,未来计划增加工具商店和自动构建功能。
Digimon Engine是一个开源的多智能体、多玩家游戏框架,专注于AI原生游戏和智能元宇宙开发。它支持社交和金融AI代理,提供沉浸式游戏体验,并致力于构建类似《西部世界》的AI代理环境。
ResearchTwin是一个开源联邦平台,将研究者的论文、数据集和代码库转化为可对话的数字孪生体,基于双模态胶质-神经优化架构,支持人类与AI智能体协作加速科学发现。