最好的动作控制 AI工具模型_精选动作控制资讯

AI资讯

宇树开源OmniXtreme人形机器人架构，流匹配技术攻克高动态动作难题

宇树科技开源人形机器人运动控制架构OmniXtreme，并发布技术论文。该架构旨在解决高动态场景下动作保真度下降与物理落地难题，采用双阶段训练框架，首阶段通过流匹配预训练整合高动态技能，提升人形机器人极限动作表现。

10.7k 12 分钟前

小米开源首代机器人 VLA 大模型，突破“物理智能”延迟瓶颈

小米开源47亿参数机器人模型Xiaomi-Robotics-0，采用MoT混合架构，通过“大脑”与“小脑”协同工作，在消费级显卡上实现实时推理，解决现有VLA模型因推理延迟导致动作迟缓的问题，提升机器人控制效率与泛化能力。

13.2k 4 小时前

世界模型走入物理世界，蚂蚁灵波开源LingBot-VA，让机器人“先思后行”

蚂蚁灵波科技开源具身世界模型LingBot-VA，首次提出自回归视频-动作世界建模框架，将视频生成与机器人控制深度融合。模型可同步生成未来世界状态并输出动作序列，实现“边推演、边行动”。真机评测显示，该模型能有效应对复杂物理交互任务。

13.3k 4 小时前

视频 AI 迎来“临界点”:可灵 AI 霸榜40国，2025年收入狂揽1.4亿美元

快手旗下可灵AI在2026年初实现爆发式增长，月活跃用户突破1200万，App付费用户环比激增350%。增长主要得益于产品快速迭代，包括2025年底发布的多模态视频模型O1和“音画同出”功能，以及2026年1月推出的“动作控制”新功能，用户可通过图片和动作参考生成视频。

15.8k 昨天

视频 AI 迎来“临界点”:可灵 AI 霸榜40国，2025年收入狂揽1.4亿美元

AI产品

WHAM

WHAM 是微软开发的一种生成式游戏模型，用于生成游戏视觉和控制器动作。

游戏生成

12.4k

MiKaPo

免费开源AI在线动作捕捉工具，控制纸片人MMD模型

3D建模

11.2k

InstructAvatar

文本引导的情感和动作控制，生成生动的2D头像

AI头像生成

15.7k

模型

wan2.5-t2v-preview

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

Doubao-SeedEdit-3.0-i2i

Bytedance

输入tokens/百万

输出tokens/百万

上下文长度

Qwen3-1.7B

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

GPT-5 nano

Openai

$0.35

输入tokens/百万

$2.8

输出tokens/百万

400

上下文长度

MiniMax Hailuo-02 1080P

Minimax

输入tokens/百万

输出tokens/百万

上下文长度

百度蒸汽机2.0

Baidu

输入tokens/百万

输出tokens/百万

上下文长度

MiniMax T2V-01

Minimax

输入tokens/百万

输出tokens/百万

上下文长度

Doubao-Seedance-1.0-lite-t2v

Bytedance

输入tokens/百万

输出tokens/百万

上下文长度

Doubao-Seedance-1.0-lite-i2v

Bytedance

输入tokens/百万

输出tokens/百万

上下文长度

MCP

Vrchat Mcp Osc

VRChat MCP OSC是一个通过OSC协议连接AI助手与VRChat的桥梁，支持AI控制虚拟角色动作、表情和交互。

typescript

9.7k

2.5分

Ros2_mcp

ROS2的MCP服务器，通过标准MCP协议让AI工具能够连接ROS2节点、主题和服务，提供主题订阅发布、服务调用、动作控制等功能，支持嵌套字段和自动类型发现，简化AI与ROS2的集成开发。

python

10.4k

2.5分

Robot Mcp Server

一个基于FastMCP的机器人控制服务器项目，支持移动动作控制，未来将扩展导航功能。

智启未来，您的人工智能解决方案智库

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

商务合作网站地图

AI资讯

宇树开源OmniXtreme人形机器人架构，流匹配技术攻克高动态动作难题

小米开源首代机器人 VLA 大模型，突破“物理智能”延迟瓶颈

世界模型走入物理世界，蚂蚁灵波开源LingBot-VA，让机器人“先思后行”

视频 AI 迎来“临界点”:可灵 AI 霸榜40国，2025年收入狂揽1.4亿美元

AI产品

WHAM

MiKaPo

InstructAvatar

模型

wan2.5-t2v-preview

Doubao-SeedEdit-3.0-i2i

Qwen3-1.7B

GPT-5 nano

MiniMax Hailuo-02 1080P

百度蒸汽机2.0

MiniMax T2V-01

Doubao-Seedance-1.0-lite-t2v

Doubao-Seedance-1.0-lite-i2v

Df_grasp_duplo_cube

Act_so100_cls_block_color

Spatialvla 4b 224 Sft Fractal

Pi0

Spatialvla 4b Mix 224 Pt

Spatialvla 4b 224 Pt

Qg_double_rm75_pour_water

Act_aloha_test

Openvla V01 7b

Octo Small 1.5

Octo Small

Octo Base

PersonaGPT

MCP

Vrchat Mcp Osc

Ros2_mcp

Robot Mcp Server