宇树科技获授权新专利,通过扩散策略提升机器人决策能力,解决动作理解偏差问题。技术核心包括场景理解、交互预测与扩散决策,旨在增强机器人对未来状态的准确认知。
斯坦福大学与Common Sense Media最新报告指出,青少年不宜依赖AI聊天机器人进行心理健康咨询。研究人员测试了ChatGPT-5、Claude、Gemini 2.5 Flash和Meta AI等主流AI,发现尽管启用家长控制功能,AI仍无法提供可靠情感支持。建议青少年寻求专业帮助。
宇树科技推出“Embodied Avatar”系统,实现人类远程操控实体机器人。通过高精度动作捕捉和毫秒级远程控制,用户可实时驱动机器人完成拳击、舞蹈等复杂动作,达成“所动即所行”的具身智能体验。核心在于全链路低延迟动作映射技术。
小鹏汽车发布新一代人形机器人IRON,采用"骨骼-肌肉-皮肤"仿生结构,配备仿人类脊椎、仿生肌肉和柔性皮肤,具备22个自由度精密控制能力,可实现自然行走和复杂手部动作。
Helix 是一款用于通用人形机器人控制的视觉-语言-行动模型。
HOMIE 是一种新型的人形机器人遥操作系统,集成人体运动捕捉与强化学习训练框架,用于实现精准的行走与操作任务。
VideoWorld是一个探索从无标签视频中学习知识的深度生成模型。
开源AI桌面机器人,具有表情屏幕、双轴控制台和语音聊天功能。
Alibaba
-
Input tokens/M
Output tokens/M
Context Length
Bytedance
32
Openai
$0.35
$2.8
400
$0.7
$1.95
16
Google
$7.7
$30.8
200
$2
128
Baidu
$1
Anthropic
$1.75
$8.75
$5.6
$28
Minimax
$1.05
$4.2
$3.5
$10.5
Tencent
$100
nbirukov
基于扩散策略的视觉运动控制模型,将机器人控制视为生成扩散过程,能够生成平滑的多步动作轨迹,在富接触操作任务中表现出色。
Ziang-Li
基于LeRobot框架训练的机器人策略模型,适用于机器人控制任务
jclinton1
Diffusion Policy 是一个基于扩散策略的机器人控制模型,通过 PyTorch 实现并集成到 Hugging Face 的模型中心。
Diffusion Policy 是一个基于扩散模型的策略学习框架,适用于机器人控制任务。
一个基于扩散策略的机器人控制模型,通过PyTorchModelHubMixin集成发布
IPEC-COMMUNITY
SpatialVLA是一个视觉-语言-动作模型,通过在fractal数据集上微调得到,主要用于机器人控制任务。
homebrewltd
PoseLess是一种创新的机器人手部控制框架,通过使用投影表示直接将2D图像映射到关节角度,无需显式的姿态估计。
Menlo
Poseless-3B 是一种基于视觉语言模型(VLM)的机器人手部控制框架,能够直接将2D图像映射到关节角度,无需显式姿态估计。
lerobot
Pi0是一个通用机器人控制的视觉-语言-动作流模型,支持机器人控制任务。
SpatialVLA是一个视觉-语言-动作模型,通过微调基础模型在分形与桥数据集上获得,专为机器人控制任务设计。
SpatialVLA是基于110万真实机器人操作片段训练的空间增强视觉语言动作模型,专注于机器人控制任务
ConnorJiang
一个基于PyTorch的动作控制模型,适用于机器人技术领域
TrossenRoboticsCommunity
一个基于PyTorch的动作控制模型,专注于机器人技术领域的动作控制任务。
Embodied-CoT
适用于机器人控制任务的预训练Transformer模型,支持运动规划、物体抓取等基础功能
一个专注于机器人技术的模型,可能涉及机器人控制、导航或任务规划等领域。
基于Diffusion Policy训练的机器人控制模型,专为PushT任务设计,使用关键点观测数据进行训练
openvla
OpenVLA v0.1 7B是一个开源视觉-语言-动作模型,基于Open X-Embodiment数据集训练,支持多种机器人控制。
rail-berkeley
Octo小型版是一个用于机器人控制的扩散策略模型,采用Transformer架构,能够根据视觉输入和语言指令预测机器人动作。
Octo小型版是一个基于扩散策略训练的机器人控制模型,能够预测未来4步的7维动作,适用于多源机器人数据集。
Octo是一个基于扩散策略训练的机器人控制基础模型,能够预测未来动作并处理多模态输入。
RegenNexus UAP是一个通用适配器协议,用于连接设备、机器人、应用和AI代理,提供低延迟、高安全性的通信,支持多种硬件和MCP集成。
该项目通过Spring AI和MCP协议实现自然语言控制mBot2机器人,包含Spring Boot应用、MQTT消息队列和机器人端Python脚本,支持探索、转向等指令的AI调用。
phospho的官方MCP服务器,实现模型上下文协议,支持通过自然语言控制物理机器人,提供执行动作和摄像头图像流功能。
ROS2的MCP服务器,通过标准MCP协议让AI工具能够连接ROS2节点、主题和服务,提供主题订阅发布、服务调用、动作控制等功能,支持嵌套字段和自动类型发现,简化AI与ROS2的集成开发。
一个基于大型语言模型和Mineflayer API的Minecraft机器人,通过MCP协议实现Claude等模型控制游戏角色。
Isaac Sim MCP扩展通过自然语言控制NVIDIA Isaac Sim,实现机器人模拟、场景创建和动态交互,连接MCP生态与具身智能应用。
一个基于Mineflayer的Minecraft模型控制协议服务器,为AI代理提供标准化JSON-RPC接口来控制Minecraft机器人。
ROS MCP服务器通过自然语言命令控制机器人运动,支持ROS和ROS2系统。
ros2-mcp-server是一个基于Python的服务器,通过Model Context Protocol (MCP)与ROS 2集成,使AI助手能够通过ROS 2话题控制机器人运动。它支持时间控制的移动命令,并作为ROS 2节点运行,发布geometry_msgs/Twist消息到/cmd_vel话题。
科沃斯推出的扫地机器人控制MCP Server,是全球首个兼容MCP协议的机器人服务,提供设备查询、清扫控制、回充控制和工作状态查询四大核心功能,大幅降低智能体应用开发门槛。
Opentrons MCP Server是一个为Opentrons机器人自动化提供API文档和直接控制功能的工具,支持Flex和OT-2型号机器人,包含协议管理、运行控制、硬件操作等功能。
ROS MCP服务器是一个支持机器人执行复杂任务和适应不同环境的工具,通过自然语言命令转换为ROS控制指令,兼容ROS和ROS2系统。
Fundamental Labs的Minecraft客户端库,支持AI代理连接Minecraft服务器并控制机器人,提供30多种已验证技能,支持多机器人管理和MCP标准兼容。
MinecraftBuildMCP是一个连接AI语言模型与Minecraft的MCP服务器,通过自然语言控制Minecraft机器人实现自动化建造、探索和交互。
一个基于FastMCP的机器人控制服务器项目,支持移动动作控制,未来将扩展导航功能。
一个现代化的MCP服务器,允许AI助手通过自然语言控制飞利浦Hue智能照明系统,提供智能灯光搜索、房间区域管理、场景激活等功能,优化了聊天机器人交互体验。
ROS2MCP是一个将ROS 2服务和主题转换为MCP工具和资源的项目,支持在Linux、macOS和Windows上运行,并通过MCP协议与客户端交互。
多机器人控制MCP代理项目
一个用于管理会议机器人的MCP服务器,支持创建机器人、管理会议、发送消息及获取会议记录等功能。
通过Telegram机器人远程控制Minecraft服务器的RCON项目