智谱AI推出清影2.0,基于自研CogVideoX模型,可直接生成1080P高清视频,最长10秒。模型全面控制运动、镜头和风格,支持多视频同时生成及镜头指定。实测画质接近Sora,中文提示理解更准、生成更快。还集成CogSound音效模块,实现文本到视频的高效创作。
杭州宇树科技公布新专利,通过数字孪生技术提升机器人舞台表演的灵活性与适应性。该技术包含环境采集、地图处理、数字舞台孪生、舞蹈动作设计、轨迹规划及舞蹈合成六大功能模块,旨在实现复杂精彩的机器人舞蹈表演。
杭州宇树科技公开机器人运动控制专利,通过数字孪生技术解决舞蹈表演中环境脱节问题。专利包含环境采集、地图处理等六个模块,旨在提升机器人舞台表现力。
英飞凌与英伟达达成战略合作,结合双方在微控制器、传感器和智能执行器方面的技术优势,共同推动人形机器人发展。合作将利用英伟达Jetson Thor模块,为OEM和ODM提供高效、强大且可扩展的运动控制解决方案,助力制造、物流和医疗等领域应用。
Kling 2.6 AI是专业AI视频生成器,支持原生音频,1080p画质和精准运动控制
使用Wan 2.2 AI生成高质量视频,具有电影级审美控制和专业运动生成,适用于创作者、营销人员和内容制作人。
一种用于控制视频扩散模型运动模式的高效方法,支持运动模式的自定义和迁移。
ASAP是一种用于学习敏捷人形机器人全身技能的技术,通过模拟与现实物理对齐实现技能迁移。
Alibaba
-
Input tokens/M
Output tokens/M
Context Length
Bytedance
32
Tencent
Openai
$0.35
$2.8
400
Stepfun
Baidu
Minimax
nbirukov
基于扩散策略的视觉运动控制模型,将机器人控制视为生成扩散过程,能够生成平滑的多步动作轨迹,在富接触操作任务中表现出色。
bytedance-research
ATI 是一个基于轨迹的运动控制框架,统一了视频生成中的物体、局部和相机运动。
obvious-research
OnlyFlow是基于光流的视频扩散模型,用于精确控制视频生成中的运动
Embodied-CoT
适用于机器人控制任务的预训练Transformer模型,支持运动规划、物体抓取等基础功能
sb3
这是一个基于SAC算法的强化学习模型,用于在Hopper-v3环境中控制机器人跳跃运动。
ROS MCP服务器通过自然语言命令控制机器人运动,支持ROS和ROS2系统。
ros2-mcp-server是一个基于Python的服务器,通过Model Context Protocol (MCP)与ROS 2集成,使AI助手能够通过ROS 2话题控制机器人运动。它支持时间控制的移动命令,并作为ROS 2节点运行,发布geometry_msgs/Twist消息到/cmd_vel话题。