微软推出Rho-alpha AI模型,推动机器人技术向“物理AI”转型。该模型旨在让机器人适应复杂多变的现实环境,摆脱对预设场景的依赖,并能理解并执行人类自然语言指令。
AI投资正从虚拟转向现实,物理AI成新热点。半导体初创公司Ethernovia获9000万美元B轮融资,显示资本正关注支撑机器人和自动驾驶的硬件供应商。投资者意识到,实现这些技术落地需硬件支持,资金流向发生结构性变化。
奇瑞汽车在AI之夜上发布墨甲机器人,将具身智能作为第三增长曲线,标志着AI战略从座舱延伸至物理世界。该机器人已投入实际应用,依托奇瑞技术实现行走、交互与任务执行。
OpenAI发布提案征集,旨在提升美国本土AI硬件生产能力,以应对全球AI竞争。公司强调AI生态不仅依赖高性能芯片,还需复杂物理硬件支撑。为此,OpenAI正招募美国本土制造商与供应商,提供从核心计算硬件到数据中心冷却系统等关键基础设施组件。
免费AI图像放大器和增强器,物理感知重建,还原真实纹理细节。
Runway Gen 4.5 AI可生成1080p电影级视频,具备导演模式和物理模拟
Ovi AI视频生成器,无需注册,秒速生成物理精确且音画同步的专业视频。
OpenAI的Sora 2 AI,实现物理精确视频生成,有同步音频和客串功能
Xai
$1.4
输入tokens/百万
$3.5
输出tokens/百万
2k
上下文长度
Anthropic
$105
$525
200
Google
$0.7
$2.8
1k
$7
$35
$2.1
$17.5
$21
Alibaba
-
Baidu
128
$6
$24
256
Bytedance
$1.2
$3.6
4
$2
$3.9
$15.2
64
XiaomiMiMo
米模具身模型(MiMo-Embodied)是一款强大的跨具身视觉语言模型,在自动驾驶和具身AI任务中均展现出了卓越的性能。它是首个将这两个关键领域相结合的开源视觉语言模型,显著提升了在动态物理环境中的理解和推理能力。
nvidia
Cosmos-Predict2.5是NVIDIA开发的专为物理AI设计的高性能预训练世界基础模型套件,基于扩散模型技术,能够根据文本、图像或视频输入生成具有物理感知的高质量图像和视频,为自动驾驶、机器人等应用提供世界模拟能力。
unsloth
Cosmos-Reason1是NVIDIA开发的物理AI模型,能够理解物理常识并通过长链思维推理生成具身决策自然语言。
Cosmos-Reason1是NVIDIA开发的物理人工智能模型,具备理解物理常识的能力,能通过长链思维推理生成具身决策。该模型支持多模态输入(文本+视频/图像),输出为文本,适用于机器人、自动驾驶等物理AI领域。
AvaLovelace
LegoGPT是首个通过文本提示生成物理稳定乐高积木模型的AI系统,基于Llama-3.2-1B-Instruct微调而成。
Cosmos-Predict2是一套高性能的预训练世界基础模型,专为物理AI开发而设计,可生成具有物理感知的图像、视频和世界状态。
Cosmos-Predict2是一系列高性能的预训练世界基础模型,专为物理AI开发生成具备物理感知的图像、视频和世界状态而设计。
Cosmos-Predict2是一系列高性能的预训练世界基础模型,专为生成具备物理感知的图像、视频和世界状态而设计,可用于物理AI的开发。
Cosmos-Reason1是NVIDIA开发的物理AI模型,能够理解物理常识并通过长链思维推理生成具身决策。
deepnight-research
Saily 220B是基于Llama2-70B合并构建的强大AI模型,在多个特定领域数据集上进行了微调,具备代码、幽默、数学、逻辑理解、物理、推理、心理学、角色扮演等多方面能力。
mcp2tcp是一个连接物理硬件与AI大模型的桥梁项目,通过MCP协议实现自然语言控制硬件设备。
这是一个基于模型上下文协议(MCP)的服务器,允许AI助手通过远程控制API来控制Unreal Engine游戏引擎,实现游戏开发自动化,支持资产管理、角色控制、编辑器操作、关卡管理、动画物理、视觉效果、Sequencer等多种功能。
MCP2Serial是一个连接物理设备与AI大模型的桥梁项目,通过自然语言控制硬件设备,实现物联网智能化控制。