马斯克宣布xAI与SpaceX合并后,将重心转向航天工程,计划在月球建立人工智能深空补给站,并招募对月球自动驾驶汽车项目感兴趣的人才。
2026年初,手机行业迎来颠覆性变革。努比亚推出的豆包手机被定义为“新物种”,凭借超前的交互理念改写用户对手机的认知。中兴通讯副总裁张雷高度评价其带来类似“全自动驾驶”的智能体验。
Waymo 完成 160 亿美元融资,由 Dragoneer Investment Group 领投。资金将用于加速无人驾驶出租车业务在美国及海外市场的扩张,推动自动驾驶进入大规模商业化冲刺阶段。Dragoneer 的参与引发市场对 Waymo 可能即将进行 IPO 的猜测。
自动驾驶汽车依赖路标识别,但加州大学研究揭示其致命弱点:攻击者通过打印特定文本的标识,就能利用视觉语言模型漏洞,诱导车辆做出危险决策,甚至驶向行人。这种“CHAI”攻击暴露了AI系统对视觉指令的过度依赖风险。
Ground是主要用于Shopify品牌的AI引擎,可在自动驾驶模式下推动营收增长。
GAIA-2 是一个先进的视频生成模型,用于创建安全的自动驾驶场景。
NVIDIA Cosmos是用于物理AI开发的世界基础模型平台。
开源的端到端自动驾驶多模态模型
XiaomiMiMo
米模具身模型(MiMo-Embodied)是一款强大的跨具身视觉语言模型,在自动驾驶和具身AI任务中均展现出了卓越的性能。它是首个将这两个关键领域相结合的开源视觉语言模型,显著提升了在动态物理环境中的理解和推理能力。
nvidia
Cosmos-Predict2.5是NVIDIA开发的专为物理AI设计的高性能预训练世界基础模型套件,基于扩散模型技术,能够根据文本、图像或视频输入生成具有物理感知的高质量图像和视频,为自动驾驶、机器人等应用提供世界模拟能力。
unsloth
Cosmos-Reason1是NVIDIA开发的物理人工智能模型,具备理解物理常识的能力,能通过长链思维推理生成具身决策。该模型支持多模态输入(文本+视频/图像),输出为文本,适用于机器人、自动驾驶等物理AI领域。
ustc-community
D-FINE是一个用于目标检测的先进模型,通过重新定义DETR模型中的边界框回归任务,实现了出色的定位精度。该模型采用细粒度分布细化(FDR)和全局最优定位自蒸馏(GO-LSD)两个关键组件,在自动驾驶、监控系统等多种实时目标检测场景中表现优异。
ayeshaishaq
DriveLMM-o1是专为自动驾驶优化的微调大型多模态模型,基于InternVL2.5-8B架构并通过LoRA技术进行适配,利用拼接的多视角图像实现逐步推理。
yasirfaizahmed
基于YOLOv8框架微调的车牌检测模型,适用于自动驾驶和交通监控场景
saninmohammedn
基于Mask2Former框架微调的语义分割模型,适用于道路场景理解和自动驾驶等应用