物理AI正成为科技巨头新战场。OpenAI、英伟达与特斯拉近期在具身智能领域推出重大举措,表明机器人产业竞争从硬件制造升级为底层基础设施与行业标准制定。OpenAI新成立“OpenAI Robotics”团队,标志着科技巨头深度下场,打破初创和传统企业主导格局。
OpenAI宣布成立Robotics事业部,将AI从软件拓展至具身智能领域,旨在通过大模型连接物理世界。CEO山姆·奥特曼公开招募全栈硬件、运营、系统及机器学习工程师,强调AI应切实帮助人类生活。团队计划分阶段推进,短期内专注研发,以逐步实现现实世界应用。
腾讯 Robotics X 与混元团队联合开源HY-Embodied-0.5-X多模态大模型,专为机器人具身任务优化。该模型基于MoT-2B架构,强化“看懂、想清、做到”能力,在精细操作、空间推理、动作预测和风险判断上表现突出。系列包含MoT-2B和MoE-32B两个版本,旨在提升机器人在真实环境的智能交互水平。
波士顿动力与谷歌DeepMind合作,将Gemini Robotics-ER1.6 AI模型集成到Spot机器人中,显著提升了其在工业检测中的能力,特别是在泄漏识别和仪表数据读取方面,增强了机器人的自主决策性能。
基于Gemini 2.0的机器人模型,将AI带入物理世界,具备视觉、语言和动作能力。
用于双手操作的扩散基础模型
robotics-diffusion-transformer
RDT-170M是一个拥有1.7亿参数的模仿学习扩散Transformer模型,用于机器人视觉-语言-动作任务。
Ethan-pooh
基于robotics-diffusion-transformer/rdt-1b衍生的RDT模型,专注于机器人技术领域。
基于100万+多机器人操作数据预训练的10亿参数模仿学习扩散Transformer模型,支持多视角视觉语言动作预测