百度发布文心大模型5.0正式版,拥有2.4万亿参数,实现从多模态融合到“原生全模态”的跨越。其采用原生全模态统一建模技术,在统一架构中对文本、图像、视频和音频进行联合训练,区别于行业常见的“后期合成”方案。
PixVerse R1作为全球首个通用实时世界模型,通过Omni原生多模态模型等三大核心技术协同,实现了虚拟世界的实时交互体验。该模型在游戏、影视、直播等领域拓展了“人人可共创”的新可能,旨在“让虚拟世界活起来”。
重庆市发布“人工智能+”行动方案,以“智能原生”为核心,系统培育AI驱动的消费新产品、新服务与新业态,构建覆盖个人、家庭与商业场景的全栈式AI终端生态。方案聚焦六大方向,推动AI与硬件深度融合,包括支持研发具备多模态交互与深度意图理解能力的AI手机、AI计算机等智能终端设备升级。
AI专家Ilya Sutskever指出,单纯扩大模型规模的时代已结束,未来突破将依赖更智能的架构设计。这标志着AI发展从“唯规模论”转向新路径。在此背景下,中国团队推出了开源原生多模态架构NEO,为领域创新提供新方向。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
-
Anthropic
$105
$525
200
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
$6
$24
Baidu
128
$2
$20
$8
$240
52
NexaAI
OmniNeural是全球首个专门为神经处理单元(NPU)设计的全多模态模型,能够原生理解文本、图像和音频,可在PC、移动设备、汽车、物联网和机器人等多种设备上运行。