Liquid AI推出LFM2.5-1.2B-Thinking推理模型,拥有12亿参数,专为复杂逻辑推理和数学任务设计。该模型在端侧部署上实现突破,仅占用约900MB内存,可在现代手机上完全离线运行,将两年前需数据中心支持的推理能力成功迁移至个人移动设备。
腾讯混元开源翻译模型1.5版本,推出1.8B和7B两个尺寸模型,主打高效与高质量翻译,优化端云协同体验。其中1.8B模型专为手机等设备设计,量化后仅需1GB内存即可离线流畅运行,实现端侧部署与卓越性能。
QuestMobile报告显示,2025年中国AI终端生态快速发展,智能穿戴、家居和汽车领域成重点。国产算力芯片崛起推动轻量化、低成本端侧部署成为主流,用户需求持续增长。智能穿戴App月活用户达1.59亿,同比增长12.8%,AI眼镜、AR/VR头显和AI手表等新兴产品备受关注。
中科曙光与湖南汇视威在长沙联合发布"橘洲"V1.5端侧版,这是国产首个基于国产算力训练的视觉基座大模型重要升级。新版本实现从"单系统"到"全生态"转型,全面适配安卓系统,构建跨平台、多芯片的端侧AI部署能力,标志着国产AI视觉技术在端侧部署领域取得新突破。
端侧全模态理解开源模型
端侧可用的GPT-4V级多模态大模型
Google
$0.49
输入tokens/百万
$2.1
输出tokens/百万
1k
上下文长度
$17.5
Alibaba
$0.3
-
32
$140
$280
Baidu
Tencent
$1
$3
4
$0.7
$1.4
131
$2
NexaAIDev
全球最快、最高效的端侧部署音频语言模型,2.6B参数的多模态模型,可同时处理文本和音频输入。