蚂蚁集团发布LingBot-VLA模型,专注于机器人复杂操控,通过海量数据训练实现跨形态通用能力。研发团队在9种主流双臂机器人上采集约2万小时真实数据,涵盖丰富动作序列,推动具身智能领域进展。
宇树开源UnifoLM-VLA-0大模型,专为通用人形机器人设计,实现视觉-语言-动作深度融合。该模型突破传统视觉语言模型局限,通过机器人操作数据预训练,推动机器人大脑从图文理解向具备物理常识的具身智能迈进。
机器人软件公司OpenMind推出专为机器人设计的应用商店,旨在解决硬件发展快而软件适配慢的问题。该平台基于模块化操作系统OM1,让四足和人形机器人能像手机一样更新应用,突破出厂功能限制,提升现实环境中的灵活应用能力。
中央广播电视总台宣布,银河通用机器人成为2026年春晚指定具身大模型机器人。这标志着国产具身智能机器人从实验室迈向国民舞台,完成科技与艺术的跨界融合,在春晚这一高难度直播场景中展现前沿实力。
Figure 03是日常通用人形机器人,用Helix AI适应家庭环境。
Helix 是一款用于通用人形机器人控制的视觉-语言-行动模型。
一种基于视频扩散模型的多任务灵巧手操控通用机器人策略
通用型物理引擎,用于机器人学和物理AI应用
Xai
$1.4
Input tokens/M
$3.5
Output tokens/M
2k
Context Length
Bytedance
$1.2
$3.6
4
Alibaba
-
Deepseek
$4
$12
128
$15
1k
$0.7
$1.95
16
Tencent
$0.8
$2
32
Google
Baidu
$0.3
$0.6
Huawei
Anthropic
$21
$105
200
Openai
$14
$56
$7.7
$30.8
$1.5
$6
mbreuss
FlowerVLA是一个针对CALVIN D数据集预训练的视觉-语言-动作流模型,采用高效的流匹配架构,仅约10亿参数即可实现通用机器人操作策略。
nvidia
英伟达Isaac GR00T N1是全球首个面向通用人形机器人推理与技能的开源基础模型,具有20亿参数规模。
lerobot
Pi0是一个通用机器人控制的视觉-语言-动作流模型,支持机器人控制任务。
etri-lirs
EAGLE是韩国电子通信研究院(ETRI)开发的31亿参数解码器因果语言模型,专注于STEM领域特别是数学和定量推理。该模型经过7200亿标记的预训练,采用LLaMA兼容架构,但并非通用语言模型,需要额外微调才能用于聊天机器人等应用。
RegenNexus UAP是一个通用适配器协议,用于连接设备、机器人、应用和AI代理,提供低延迟、高安全性的通信,支持多种硬件和MCP集成。
Image Gen MCP Server是一个通用AI图像生成服务,通过Model Context Protocol(MCP)标准协议为各类LLM聊天机器人提供跨平台、多模型的图像生成能力,支持OpenAI和Google的多种图像模型,实现文本对话到可视化内容的无缝转换。
NONEAD通用机器人MCP服务器