阿里推出新一代多模态智能体模型Qwen3.7-Plus,标志着国产大模型向具身智能与高级智能体演进加速。该模型继承Qwen3.7强大文本处理能力,在多模态领域实现技术飞跃,为端侧与复杂工作流应用提供核心底座迭代。
面壁智能联合清华大学及OpenBMB开源社区发布新一代端侧多模态大模型MiniCPM-V4.6,仅1.3B参数,推出Instruct与Thinking两个版本,凭借高智能密度与跨平台适配能力,在多项评测中表现超越更大参数模型,加速端侧AI应用落地。
面壁智能联合清华大学及OpenBMB开源社区发布MiniCPM-V 4.6端侧多模态大模型,仅1.3B参数、6G内存即可流畅运行,性能卓越,在内存涨价背景下实现“低内存、极速跑”,为AI应用拓展新可能。
谷歌发布开源大模型Gemma4,通过“单位参数智能”提升,为开源模型辅助智能体工作流设定新标准。该系列包含2.3B、4.5B高效版及26B、31B高性能版,基于Gemini3技术栈,全系支持多模态输入,部分版本原生支持语音输入,实现端侧实时语音理解。
端侧可用的GPT-4V级多模态大模型
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
$2
$20
Baidu
128
$6
$24
$8
$240
52
Bytedance
$1.2
$3.6
4
NexaAIDev
全球最快、最高效的端侧部署音频语言模型,2.6B参数的多模态模型,可同时处理文本和音频输入。