Mininglamp 开源了两个本地AI项目Cider和Mano-P,分别解决Mac端侧推理加速和GUI智能体操作痛点。Cider释放M系列芯片潜能,让LLM/VLM在本地运行更快更省资源;Mano-P则提升智能体操作效率。这使Mac从“能跑AI”升级为高效、私有、可深度操控的AI工作站,打造完整本地AI基础设施。
苹果利用知识蒸馏技术,将谷歌Gemini云端大模型转化为适用于iPhone的轻量化端侧组件。根据2026年3月消息,苹果与谷歌达成协议,允许其工程师深度访问并研究Gemini全量模型。此举增强了苹果在AI领域的自主性,使其能直接借鉴Gemini的高质量输出与推理过程。
Liquid AI推出LFM2.5-1.2B-Thinking推理模型,拥有12亿参数,专为复杂逻辑推理和数学任务设计。该模型在端侧部署上实现突破,仅占用约900MB内存,可在现代手机上完全离线运行,将两年前需数据中心支持的推理能力成功迁移至个人移动设备。
vivo在2025开发者大会上发布蓝心3B端侧多模态推理大模型。这款30亿参数模型是业内首个集成五大核心能力的"One Model",经过一年训练优化,实现移动设备本地部署复杂多模态AI能力的重大突破,确立行业领先地位。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
-
Anthropic
$21
$105
200
Alibaba
$4
$16
Baidu
128
Moonshot
256
Bytedance
$0.8
$2
Tencent
$1
32
$54
$163
Deepseek
$12
$1.6
$0.4
$15
Iflytek
$3.5
Xai
Mungert
MiniCPM4.1-8B GGUF是专为端侧设备设计的高效大语言模型,在模型架构、训练数据、训练算法和推理系统四个关键维度进行了系统创新,实现了极致的效率提升。支持65,536个标记的上下文长度和混合推理模式。
MiniCPM4-8B是专为端侧设备设计的高效大语言模型,通过模型架构、训练数据、训练算法和推理系统四个维度的创新,实现了极致的效率提升。
openbmb
MiniCPM4是专为端侧设备设计的高效大语言模型,通过系统创新在模型架构、训练数据、训练算法和推理系统四个关键维度实现极致的效率提升。
MiniCPM4是专为端侧设备设计的高效大语言模型,通过系统创新在模型架构、训练数据、训练算法和推理系统四个维度实现极致效率提升,在端侧芯片上可实现超5倍的生成加速。
Infinigence
Megrez-3B是由无问芯穹完全自主训练的大语言模型,通过软硬协同理念,打造出极速推理、小巧精悍、极易上手的端侧智能解决方案。该模型将14B模型的能力压缩进3B大小的模型中,在主流榜单上取得了优异的性能表现。