面壁智能联合清华大学及OpenBMB开源社区发布MiniCPM-V 4.6端侧多模态大模型,仅1.3B参数、6G内存即可流畅运行,性能卓越,在内存涨价背景下实现“低内存、极速跑”,为AI应用拓展新可能。
谷歌发布开源大模型Gemma4,通过“单位参数智能”提升,为开源模型辅助智能体工作流设定新标准。该系列包含2.3B、4.5B高效版及26B、31B高性能版,基于Gemini3技术栈,全系支持多模态输入,部分版本原生支持语音输入,实现端侧实时语音理解。
面壁智能发布首款AI端侧开发板“松果派”,基于NVIDIA Jetson模组,集成麦克风、摄像头等多模态接口,适配自研MiniCPM系列模型,旨在让开发者便捷构建智能硬件。
Rokid正与顶尖大模型公司合作开发新一代AI智能眼镜,以生成式AI和AI智能体为核心,打造革命性操作系统和界面。该眼镜采用端侧多模态模型,支持语音、视觉和触控等多种交互方式,旨在提供全新用户体验。
端侧可用的GPT-4V级多模态大模型
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
$2
$20
$6
$24
Baidu
128
$8
$240
52
Bytedance
$1.2
$3.6
4
NexaAIDev
全球最快、最高效的端侧部署音频语言模型,2.6B参数的多模态模型,可同时处理文本和音频输入。