苹果在WWDC2026发布Apple Intelligence驱动的全新Siri AI,实现个人情境理解、知识库调用和屏幕实时感知能力跃升,同时推出新一代端侧AI大模型,但硬件门槛提高引发市场关注。
Google发布全新开源大模型Gemma412B,采用“Unified”无编码器架构,突破端侧全模态AI。该模型无需传统视觉、音频外部编码器,直接输入文字、图像、音频、视频四种模态数据至同一Transformer主干网络处理,消除了外挂“翻译”模块带来的显存占用和高延迟问题。
人工智能初创公司Liquid AI发布并开源了端侧大模型LFM2.5-8B-A1B,专为消费级硬件设计,优化工具调用和指令遵循能力。该模型采用稀疏混合专家架构,总参数量8.3B,但每个Token仅激活1.5B参数,在降低计算成本的同时提升推理性能,可流畅运行于手机和笔记本电脑上。
苹果计划在OS 27中推出本地端侧AI处理方案,通过“蒸馏”技术利用谷歌Gemini模型训练轻量级AI模型,以平衡用户隐私与性能。该方案使小模型接近大模型效果,同时大幅降低处理成本,确保AI功能在苹果设备上高效运行。
腾讯推出的更懂你的24小时在线AI助手,支持端侧大模型隐私模式与手机深度遥控电脑。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
Baidu
128
$6
$24
$2
$20
neuphonic
NeuTTS Air是世界上首个具备即时语音克隆功能的超逼真、端侧文本转语音(TTS)语言模型。基于0.5B参数的大语言模型骨干构建,能为本地设备带来自然的语音、实时性能、内置安全性和说话人克隆功能。