智谱AI推出清影2.0,基于自研CogVideoX模型,可直接生成1080P高清视频,最长10秒。模型全面控制运动、镜头和风格,支持多视频同时生成及镜头指定。实测画质接近Sora,中文提示理解更准、生成更快。还集成CogSound音效模块,实现文本到视频的高效创作。
杭州宇树科技公布新专利,通过数字孪生技术提升机器人舞台表演的灵活性与适应性。该技术包含环境采集、地图处理、数字舞台孪生、舞蹈动作设计、轨迹规划及舞蹈合成六大功能模块,旨在实现复杂精彩的机器人舞蹈表演。
杭州宇树科技公开机器人运动控制专利,通过数字孪生技术解决舞蹈表演中环境脱节问题。专利包含环境采集、地图处理等六个模块,旨在提升机器人舞台表现力。
英飞凌与英伟达达成战略合作,结合双方在微控制器、传感器和智能执行器方面的技术优势,共同推动人形机器人发展。合作将利用英伟达Jetson Thor模块,为OEM和ODM提供高效、强大且可扩展的运动控制解决方案,助力制造、物流和医疗等领域应用。
Kling 3 AI可将文本转化为4K专业视频,有先进运动控制和自然音频。
Kling 3.0免费AI视频生成器,支持文本、图像转视频,有先进运动控制。
2026 年领先 AI 生成器,支持原生 4K、音频和 Canvas Agent,创电影级视频。
Kling 2.6 AI是专业AI视频生成器,支持原生音频,1080p画质和精准运动控制
Alibaba
-
输入tokens/百万
输出tokens/百万
上下文长度
Bytedance
32
Tencent
Openai
$0.35
$2.8
400
Stepfun
Baidu
Minimax
nbirukov
基于扩散策略的视觉运动控制模型,将机器人控制视为生成扩散过程,能够生成平滑的多步动作轨迹,在富接触操作任务中表现出色。
bytedance-research
ATI 是一个基于轨迹的运动控制框架,统一了视频生成中的物体、局部和相机运动。
obvious-research
OnlyFlow是基于光流的视频扩散模型,用于精确控制视频生成中的运动
Embodied-CoT
适用于机器人控制任务的预训练Transformer模型,支持运动规划、物体抓取等基础功能
sb3
这是一个基于SAC算法的强化学习模型,用于在Hopper-v3环境中控制机器人跳跃运动。
ROS MCP服务器通过自然语言命令控制机器人运动,支持ROS和ROS2系统。
ros2-mcp-server是一个基于Python的服务器,通过Model Context Protocol (MCP)与ROS 2集成,使AI助手能够通过ROS 2话题控制机器人运动。它支持时间控制的移动命令,并作为ROS 2节点运行,发布geometry_msgs/Twist消息到/cmd_vel话题。