硅光子初创公司Ayar Labs完成5亿美元E轮融资,由Neuberger Berman领投,英伟达、联发科等参投,旨在加速其共封装光学(CPO)技术量产。此前一天,英伟达刚向光子网络供应商注资40亿美元,显示其在光子互连领域的积极布局。核心目标是突破铜线物理极限,应对AI算力需求激增带来的数据传输瓶颈。
阿里巴巴旗下AI助手“千问”宣布进军硬件领域,将推出首款AI眼镜,并计划在2026年世界移动通信大会上亮相。此举旨在实现“软硬一体”战略,让千问助手从手机屏幕延伸至物理世界,成为跨终端智能助手。
Anthropic 为 AI 编程助手 Claude Code 推出“远程控制”模式,用户可通过手机对本地运行的 AI 智能体直接下达编程指令。该功能通过“安全同步层”连接桌面与移动设备,无需云端环境,用手机扫描终端二维码即可远程操作,旨在打破办公物理限制,提升开发灵活性。
谷歌将AI机器人公司Intrinsic并入核心业务,战略重心从对话式AI转向具身智能与智能制造,旨在为机器人打造通用大脑,加速AI在物理生产线的应用。
Seedance 2.0可通过多镜头连贯、原生音频同步和物理感知运动创建电影级AI视频。
免费AI图像放大器和增强器,物理感知重建,还原真实纹理细节。
Runway Gen 4.5 AI可生成1080p电影级视频,具备导演模式和物理模拟
Ovi AI视频生成器,无需注册,秒速生成物理精确且音画同步的专业视频。
Xai
$1.4
Input tokens/M
$3.5
Output tokens/M
2k
Context Length
Anthropic
$105
$525
200
Google
$0.7
$2.8
1k
$7
$35
$2.1
$17.5
$21
Alibaba
-
$6
$24
256
Baidu
128
Bytedance
$1.2
$3.6
4
$2
$3.9
$15.2
64
XiaomiMiMo
米模具身模型(MiMo-Embodied)是一款强大的跨具身视觉语言模型,在自动驾驶和具身AI任务中均展现出了卓越的性能。它是首个将这两个关键领域相结合的开源视觉语言模型,显著提升了在动态物理环境中的理解和推理能力。
nvidia
Cosmos-Predict2.5是NVIDIA开发的专为物理AI设计的高性能预训练世界基础模型套件,基于扩散模型技术,能够根据文本、图像或视频输入生成具有物理感知的高质量图像和视频,为自动驾驶、机器人等应用提供世界模拟能力。
unsloth
Cosmos-Reason1是NVIDIA开发的物理AI模型,能够理解物理常识并通过长链思维推理生成具身决策自然语言。
Cosmos-Reason1是NVIDIA开发的物理人工智能模型,具备理解物理常识的能力,能通过长链思维推理生成具身决策。该模型支持多模态输入(文本+视频/图像),输出为文本,适用于机器人、自动驾驶等物理AI领域。
AvaLovelace
LegoGPT是首个通过文本提示生成物理稳定乐高积木模型的AI系统,基于Llama-3.2-1B-Instruct微调而成。
Cosmos-Predict2是一套高性能的预训练世界基础模型,专为物理AI开发而设计,可生成具有物理感知的图像、视频和世界状态。
Cosmos-Predict2是一系列高性能的预训练世界基础模型,专为物理AI开发生成具备物理感知的图像、视频和世界状态而设计。
Cosmos-Predict2是一系列高性能的预训练世界基础模型,专为生成具备物理感知的图像、视频和世界状态而设计,可用于物理AI的开发。
Cosmos-Reason1是NVIDIA开发的物理AI模型,能够理解物理常识并通过长链思维推理生成具身决策。
deepnight-research
Saily 220B是基于Llama2-70B合并构建的强大AI模型,在多个特定领域数据集上进行了微调,具备代码、幽默、数学、逻辑理解、物理、推理、心理学、角色扮演等多方面能力。
mcp2tcp是一个连接物理硬件与AI大模型的桥梁项目,通过MCP协议实现自然语言控制硬件设备。
这是一个基于模型上下文协议(MCP)的服务器,允许AI助手通过远程控制API来控制Unreal Engine游戏引擎,实现游戏开发自动化,支持资产管理、角色控制、编辑器操作、关卡管理、动画物理、视觉效果、Sequencer等多种功能。
MCP2Serial是一个连接物理设备与AI大模型的桥梁项目,通过自然语言控制硬件设备,实现物联网智能化控制。