6月16日,谷歌正式发布Android 17最终版、Wear OS 7及Pixel Drop更新,为Pixel系列注入最新AI基础设施,标志端侧AI应用生态深化。核心战略依托Gemini Omni多模态大模型,全面落地多模态能力,重构底层系统交互。
Google发布全新开源大模型Gemma412B,采用“Unified”无编码器架构,突破端侧全模态AI。该模型无需传统视觉、音频外部编码器,直接输入文字、图像、音频、视频四种模态数据至同一Transformer主干网络处理,消除了外挂“翻译”模块带来的显存占用和高延迟问题。
Rokid正与顶尖大模型公司合作开发新一代AI智能眼镜,以生成式AI和AI智能体为核心,打造革命性操作系统和界面。该眼镜采用端侧多模态模型,支持语音、视觉和触控等多种交互方式,旨在提供全新用户体验。
vivo发布全新端侧多模态模型BlueLM-2.5-3B,具备GUI理解能力。该模型采用2.9B参数设计,支持长短思考模式切换,在20余项评测中表现优异:文本处理能力突出,有效缓解多模态模型"遗忘问题";长思考模式下数学和逻辑推理能力显著优于同规模模型;GUI理解能力尤其出色,得益于大量中文应用截屏数据训练。模型通过优化数据利用策略和训练流程,实现了高效低成本运行,为AI普及应用奠定基础。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
Anthropic
$105
$525
200
$0.7
$7
$35
$17.5
$21
Alibaba
-
$1
$10
256
$2
$20
$8
$240
52
Bytedance
$1.2
$3.6
4