Generalist公司发布GEN-0基础模型,揭示机器人缩放定律,推动技术从任务定制迈向通用智能。该模型基于27万小时真实世界数据训练,实现跨硬件平台“边想边做”能力,被喻为机器人领域的“ChatGPT时刻”,强调真实数据优于模拟环境。
宇树科技推出“Embodied Avatar”系统,实现人类远程操控实体机器人。通过高精度动作捕捉和毫秒级远程控制,用户可实时驱动机器人完成拳击、舞蹈等复杂动作,达成“所动即所行”的具身智能体验。核心在于全链路低延迟动作映射技术。
字节跳动通过火山引擎高薪招聘具身智能算法专家,月薪9.5万至12万元,显示其正聚焦人形机器人研发,实质性布局前沿科技赛道。
魔珐科技发布全球首个3D数字人开放平台“魔珐星云”,让AI从文字对话升级为实时生成带表情、手势和身体动作的3D数字人。其核心3D多模态引擎可输入文本后毫秒级输出同步语音与动作,并适配手机、车载等多种终端,实现AI从“说话”到“表演”的进化。
智元机器人发布的具身智能一站式开发平台,覆盖数据采集到模型推理全链路
智元发布首个通用具身基座大模型GO-1,开创性提出ViLLA架构,推动具身智能发展。
mradermacher
SpaceQwen2.5-VL-3B-Instruct 是一个多模态视觉语言模型,专注于空间推理和具身智能任务。
facebook
VC-1是基于视觉Transformer的预训练模型,专为具身智能任务设计,如物体操作和室内导航。
Isaac Sim MCP扩展通过自然语言控制NVIDIA Isaac Sim,实现机器人模拟、场景创建和动态交互,连接MCP生态与具身智能应用。