中国移动推出首款消费级家庭服务型具身智能产品“灵犀”四足机器人,以“拟人化交互”和“场景化服务”为核心,旨在满足儿童陪伴、老人照护和家庭安全等多元化需求。产品深度融合AI大模型技术,具备强大的自然语言理解和持续学习能力,可精准理解用户意图。
IDC报告预测,到2030年具身智能机器人将占机器人市场超30%份额。这类机器人融合AI、感知与计算技术,具备自主学习和决策能力,应用领域将快速扩展。
上海AgiBot公司突破工业自动化技术,仅需10分钟即可教会机器人完成复杂制造任务。该技术融合人机远程操作与强化学习,工人先远程引导,AI系统随后接管优化,实现自我改进,有望重塑全球制造业生产方式。
清华大学等高校联合推出MotionTrans框架,实现机器人仅通过观察人类动作就能学习新技能,无需示范。这突破了传统依赖大量演示数据的高成本训练方式,显著提升机器人学习效率。
HOMIE 是一种新型的人形机器人遥操作系统,集成人体运动捕捉与强化学习训练框架,用于实现精准的行走与操作任务。
ASAP是一种用于学习敏捷人形机器人全身技能的技术,通过模拟与现实物理对齐实现技能迁移。
大规模机器人学习数据集,推动多用途机器人策略发展。
用于强化学习的Unitree机器人平台
Bytedance
$1.2
Input tokens/M
$3.6
Output tokens/M
4
Context Length
Deepseek
$4
$16
32
Iflytek
$2
-
Alibaba
$0.7
$1.95
16
Google
Openai
$14
$56
200
$7.7
$30.8
$1.6
128
$525
$1050
$1
8
Baichuan
Baidu
64
$105
$420
Anthropic
$1.75
$8.75
$5.6
$28
$21
$84
$1.05
$4.2
jclinton1
Diffusion Policy 是一个基于扩散模型的策略学习框架,适用于机器人控制任务。
mbreuss
FlowerVLA是一个针对CALVIN ABCD数据集预训练的机器人操作模型,采用创新的视觉-语言-动作流策略,仅包含10亿参数,专为机器人学习设计。
michaelyuanqwq
RoboEngine是首个即插即用的视觉机器人数据增强工具包,用户只需几行代码就能生成具有物理和任务感知能力的机器人场景,解决了现有方法受相机校准或受控环境限制的问题,显著提升了模仿学习的视觉鲁棒性。
robotics-diffusion-transformer
RDT-170M是一个拥有1.7亿参数的模仿学习扩散Transformer模型,用于机器人视觉-语言-动作任务。
theaiinstitute
忒伊亚是一个面向机器人学习的视觉基础模型,通过蒸馏多个视觉基础模型获得丰富的视觉表征能力
mihdalal
基于机器学习的机器人操作任务运动规划系统,结合神经网络与优化技术生成无碰撞运动轨迹
jimyoung6709
基于机器学习的机器人操作任务运动规划系统,结合神经网络与优化技术生成高效无碰撞轨迹
基于机器学习的机器人操作任务运动规划系统,结合神经网络与轻量级优化技术生成高效无碰撞轨迹
基于100万+多机器人操作数据预训练的10亿参数模仿学习扩散Transformer模型,支持多视角视觉语言动作预测
忒伊亚是面向机器人学习的视觉基础模型,通过蒸馏多个现成的视觉基础模型构建,具有丰富的视觉表征能力。
忒伊亚是面向机器人学习的视觉基础模型,通过蒸馏多个现成的视觉基础模型而成,具有丰富的视觉表征能力。
LLaVA-VL
LLaVA-Plus 是一个可插拔学习技能的大型语言与视觉助手,主要用于多模态模型及聊天机器人的学术研究。
lmsys
Vicuna是一个基于Llama 2微调的聊天助手模型,通过在ShareGPT收集的用户共享对话上进行有监督指令微调训练得到。该模型主要用于大语言模型和聊天机器人的研究,支持16k上下文长度,目标用户为自然语言处理、机器学习和人工智能领域的研究人员和爱好者。
Vicuna是一个基于LLaMA微调的聊天助手模型,通过在ShareGPT收集的用户共享对话上进行监督指令微调训练得到。该模型主要用于大语言模型和聊天机器人的研究,为自然语言处理、机器学习和人工智能领域的研究人员和爱好者提供强大的研究工具。
sb3
这是一个基于SAC算法的强化学习模型,用于在Hopper-v3环境中控制机器人跳跃运动。
这是一个基于SAC算法的强化学习模型,专为Walker2d-v3环境设计,能够控制双足机器人行走。
ernestumorga
这是一个基于PPO算法的强化学习智能体,专门为seals/Walker2d-v0环境训练,用于控制Walker2d机器人行走任务。