荣耀发布折叠旗舰Magic V6及AI生态“荣耀龙虾宇宙”,将端侧AI深度融入多设备协同。其开源框架OpenClaw可提供决策建议并直接控制PC、平板等终端,实现自动化任务处理。
阿里通义实验室推出Qwen3.5系列小尺寸模型,包括0.8B、2B、4B和9B四种参数规模。这些模型基于统一基座研发,主打轻量级和高适应性,旨在降低AI应用门槛,实现从端侧设备到垂直场景的低成本高效落地。
Liquid AI推出LFM2.5-1.2B-Thinking推理模型,拥有12亿参数,专为复杂逻辑推理和数学任务设计。该模型在端侧部署上实现突破,仅占用约900MB内存,可在现代手机上完全离线运行,将两年前需数据中心支持的推理能力成功迁移至个人移动设备。
三星计划2026年将搭载谷歌Gemini大模型的移动设备产量翻倍,覆盖手机、平板及可穿戴设备,以增强AI终端市场竞争力。自S24系列集成Gemini Nano以来,其端侧AI功能获用户积极反馈。
Alibaba
$0.3
Input tokens/M
-
Output tokens/M
32
Context Length
Google
$140
$280
Tencent
$1
$3
4
$2
Openai
$21
$84
128
neuphonic
NeuTTS Air是世界上首个具备即时语音克隆功能的超逼真、端侧文本转语音(TTS)语言模型。基于0.5B参数的大语言模型骨干构建,能为本地设备带来自然的语音、实时性能、内置安全性和说话人克隆功能。
Mungert
MiniCPM4.1-8B GGUF是专为端侧设备设计的高效大语言模型,在模型架构、训练数据、训练算法和推理系统四个关键维度进行了系统创新,实现了极致的效率提升。支持65,536个标记的上下文长度和混合推理模式。
openbmb
MiniCPM4.1-8B-GGUF是MiniCPM4.1-8B模型的GGUF量化格式版本,专为端侧设备设计的高效大语言模型,采用80亿参数,支持融合思维,在典型端侧芯片上可实现超过5倍的生成加速。
MiniCPM4-8B是专为端侧设备设计的高效大语言模型,通过模型架构、训练数据、训练算法和推理系统四个维度的创新,实现了极致的效率提升。
MiniCPM4 是一款专为端侧设备设计的高效大语言模型,在相同规模下保持最优性能的同时实现了极致的效率提升,在典型端侧芯片上可实现超 5 倍的生成加速。
MiniCPM4是专为端侧设备设计的高效大语言模型,在相同规模下实现了极致的效率提升和最优性能。
MiniCPM4是专为端侧设备设计的高效大语言模型,通过系统创新在模型架构、训练数据、训练算法和推理系统四个关键维度实现极致的效率提升。
MiniCPM4是专为端侧设备设计的高效大语言模型,通过系统创新在模型架构、训练数据、训练算法和推理系统四个维度实现极致效率提升,在端侧芯片上可实现超5倍的生成加速。