NVIDIA与斯坦福大学联合发布通用游戏AI智能体NitroGen,在1000多款游戏、4万小时数据上训练而成,具备强大跨游戏泛化能力。研究团队将开源数据集和模型权重,推动全球AI与游戏研究发展。
英伟达推出通用游戏智能体NitroGen,基于OpenVision动作模型,旨在成为跨虚拟世界的通用代理。其创新在于利用YouTube和Twitch上带有控制器叠加层的游戏视频作为训练数据,学习复杂操控逻辑,突破传统AI的单一用途限制。
OpenAI发布GPT-5.2-Codex,这是其最先进的智能体编程模型。它专为处理复杂、长期的现实编码任务设计,在基准测试中创下新纪录,并能自主完成从代码理解、环境搭建到漏洞挖掘和提交Pull Request的全流程。该模型融合了GPT-5.2的通用推理能力和GPT-5.1-Codex-Max的终端操作功能,标志着AI在软件工程实战能力上的重大突破。
谷歌DeepMind推出SIMA2通用智能体,升级采用Gemini模型,能理解目标、解释计划并自我学习,在复杂3D游戏中持续进步。其前身SIMA1于2024年发布,通过图像和虚拟设备控制,掌握600多项语言指令,任务完成率约31%,低于人类玩家水平。
开源的端到端产品级通用智能体
商汤基于多年技术积累和产业实践经验打造的大模型体系,引领通用人工智能发展。
基于大模型的通用信息获取智能体系统
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Anthropic
$7
$35
200
$21
$105
Alibaba
$4
$16
Baidu
-
32
Xai
$1.4
$10.5
256
$54
$163
Deepseek
$12
128
$8.75
$70
400
$1.75
$14
$1
$15
Chatglm
$8
$2
unsloth
MiniMax-M2是一款专为最大化编码和智能体工作流程而构建的小型混合专家模型,总参数达2300亿,激活参数为100亿。该模型在编码和智能体任务中表现卓越,同时保持强大的通用智能,具有紧凑、快速且经济高效的特点。
bullerwins
MiniMax-M2是一款专为最大化编码和智能体工作流程而构建的小型混合专家(MoE)模型。它拥有2300亿总参数,仅激活100亿参数,在编码和智能体任务中表现卓越,同时保持强大的通用智能,具有紧凑、快速且经济高效的特点。
MiniMax-M2是一款专为最大化编码和智能体工作流程而构建的'迷你'模型。它是一个紧凑、快速且经济高效的混合专家(MoE)模型,在编码和智能体任务中表现卓越,同时还具备强大的通用智能。
MiniMaxAI
MiniMax-M2是一款专为最大化编码和智能体工作流程而构建的'迷你'模型,采用混合专家架构,总参数2300亿,激活参数100亿。该模型在编码和智能体任务中表现卓越,同时保持强大的通用智能,具有紧凑、快速且经济高效的特点。
ByteDance-Seed
Seed-OSS是由字节跳动Seed团队开发的开源大语言模型系列,具备强大的长上下文处理、推理、智能体交互能力和通用性能。该模型仅使用12T token训练,在多个公开基准测试中表现出色。
modelscope
基于Llama3-8b-instruct基础模型训练,适配中文通用场景,支持ReACT格式的智能体调用
THUDM
AgentLM-70B 是基于 Llama-2-chat 模型通过 AgentInstruct 数据集和 ShareGPT 数据集混合训练得到的大型语言模型,专注于增强智能体能力和通用语言能力。
Open Multi-Agent Canvas是一个开源的多智能体聊天界面,支持在动态对话中管理多个智能体,用于旅行规划、研究和通用任务处理。
Jenius是一个通用多智能体AI Agent,通过集成Home Assistant实现智能家居设备的远程控制,支持多种米家设备接入。
MCP说话人分离与识别系统是一个集成了GPU加速的说话人分离、语音识别、情感检测和Web界面的完整解决方案。它结合了pyannote.audio的说话人分离与faster-whisper转录技术,支持持久化说话人识别(一次注册,永久识别)、双检测器情感分析(结合通用AI与个性化声纹)、实时流处理、REST API和MCP服务器,专为AI智能体集成和爱好项目设计。