小鹏汽车在2026年全球新品发布会上宣布,其新款车型将搭载自研的第二代VLA大模型,这是行业首个具备L4初阶能力的物理世界大模型。该模型标志着智能驾驶系统从“感知-决策”向“理解-推演-生成”新范式的转变,突破了传统依赖规则或有限场景的限制。
小鹏汽车在2026全球新品发布会上宣布,将“物理AI”与“全球化”定为年度核心战略,标志着公司从技术探索转向实践应用。物理AI技术将全面落地并实现规模化量产,同时公布了跨时代的产品交付计划。
优必选旗下优奇与火山引擎合作,整合机器人本体与云端AI技术,加速大模型在工业物流领域的应用。双方将围绕多模态大模型、VLA模型、世界模型及豆包生态展开合作,推动技术规模化落地。
北京人形机器人创新中心开源国内首个符合具身智能国家标准的VLA大模型XR-1,并配套发布RoboMIND2.0数据底座和ArtVIP高保真数字资产数据集,旨在推动机器人技术发展,为开发者提供强大支持。
Openai
$2.8
输入tokens/百万
$11.2
输出tokens/百万
1k
上下文长度
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
Baidu
128
$6
$24
$2
$20
$8
$240
52
Bytedance
$1.2
$3.6
4
VLA-Adapter
VLA-Adapter是一种在Libero-Spatial上训练的微型视觉语言动作模型,采用Prismatic-VLM架构,仅使用Qwen2.5-0.5B作为大语言模型主干。该模型在机器人基准测试中超越了参数规模更大的开源VLA模型,实现了高性能的视觉-语言-动作理解与执行。
UCSC-VLAA
VLAA-Thinker-Qwen2.5-3B是一个类似R1的推理大视觉语言模型,专注于多模态推理任务。该模型在OpenCompass多模态推理排行榜上达到了SOTA性能,支持图像理解和复杂推理能力。