蚂蚁灵波科技开源具身世界模型LingBot-VA,首次提出自回归视频-动作世界建模框架,将视频生成与机器人控制深度融合。模型可同步生成未来世界状态并输出动作序列,实现“边推演、边行动”。真机评测显示,该模型能有效应对复杂物理交互任务。
蚂蚁灵波团队开源交互式世界模型LingBot-World,为具身智能和自动驾驶等领域提供高保真、逻辑一致的虚拟训练环境。该模型通过模拟物理规律,帮助智能体在数字演练场中进行低成本试错,并将习得的行为因果关系迁移至现实世界,有效解决了真机数据稀缺、训练成本高昂的痛点。
蚂蚁灵波科技开源世界模型LingBot-World,在视频质量、动态程度等关键指标媲美Google Genie3,为具身智能、自动驾驶等领域提供高保真、可实时操控的“数字演练场”。
阿里巴巴高德地图发布自研世界模型“FantasyWorld”,利用真实导航数据在国际权威基准WorldScore Leaderboard获综合第一,拓展阿里AI布局。该模型专注于高品质3D世界构建,为具身智能和自动驾驶提供关键技术支撑。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
$6
$24
$2
$20
Baidu
128
Bytedance
$1.2
$3.6
4
$3.9
$15.2
64