中科曙光与湖南汇视威在长沙联合发布"橘洲"V1.5端侧版,这是国产首个基于国产算力训练的视觉基座大模型重要升级。新版本实现从"单系统"到"全生态"转型,全面适配安卓系统,构建跨平台、多芯片的端侧AI部署能力,标志着国产AI视觉技术在端侧部署领域取得新突破。
在2025年vivo开发者大会上,公司副总裁周围宣布了智能手机端侧AI的突破性进展,强调从云端大模型转向轻便端侧模型的趋势。此举旨在提升用户体验并推动差异化竞争。vivo发布了蓝心智能战略和OriginOS6系统,端侧大模型成为核心亮点。
北京国有资本投资面壁智能数亿元,这是国务院发布“人工智能+”行动后国内端侧大模型首笔公开融资。资金将用于研发和商业化,助力人工智能发展。
美图AI应用RoboNeo上线首月月活跃用户突破百万,公司通过内部组织变革和深度应用AI工具推动产品成功。美图CEO吴欣鸿强调“AI原生”理念,倡导从产品设计到运营全面融入人工智能技术,助力开发者把握技术趋势与创新应用。
端侧可用的GPT-4V级多模态大模型
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
$6
$24
$2
$20
Baidu
128
$8
$240
52
Bytedance
$1.2
$3.6
4
neuphonic
NeuTTS Air是世界上首个具备即时语音克隆功能的超逼真、端侧文本转语音(TTS)语言模型。基于0.5B参数的大语言模型骨干构建,能为本地设备带来自然的语音、实时性能、内置安全性和说话人克隆功能。
Mungert
MiniCPM4.1-8B GGUF是专为端侧设备设计的高效大语言模型,在模型架构、训练数据、训练算法和推理系统四个关键维度进行了系统创新,实现了极致的效率提升。支持65,536个标记的上下文长度和混合推理模式。
openbmb
MiniCPM4.1-8B-GGUF是MiniCPM4.1-8B模型的GGUF量化格式版本,专为端侧设备设计的高效大语言模型,采用80亿参数,支持融合思维,在典型端侧芯片上可实现超过5倍的生成加速。
MiniCPM4-8B是专为端侧设备设计的高效大语言模型,通过模型架构、训练数据、训练算法和推理系统四个维度的创新,实现了极致的效率提升。
MiniCPM4 是一款专为端侧设备设计的高效大语言模型,在相同规模下保持最优性能的同时实现了极致的效率提升,在典型端侧芯片上可实现超 5 倍的生成加速。
MiniCPM4是专为端侧设备设计的高效大语言模型,在相同规模下实现了极致的效率提升和最优性能。
MiniCPM4-MCP是一款开源的端侧大语言模型智能体模型,基于80亿参数的MiniCPM-4构建,能够通过MCP与各种工具和数据资源交互,解决广泛的现实世界任务。
MiniCPM4是专为端侧设备设计的高效大语言模型,通过系统创新在模型架构、训练数据、训练算法和推理系统四个关键维度实现极致的效率提升。
MiniCPM4是专为端侧设备设计的高效大语言模型,通过系统创新在模型架构、训练数据、训练算法和推理系统四个维度实现极致效率提升,在端侧芯片上可实现超5倍的生成加速。
Infinigence
Megrez-3B是由无问芯穹完全自主训练的大语言模型,通过软硬协同理念,打造出极速推理、小巧精悍、极易上手的端侧智能解决方案。该模型将14B模型的能力压缩进3B大小的模型中,在主流榜单上取得了优异的性能表现。
MiniCPM是面壁智能与清华大学自然语言处理实验室联合研发的端侧大语言模型系列,核心模型仅含12亿非词嵌入参数,在多项评测中超越更大规模的开源模型。
MiniCPM是由面壁智能与清华大学自然语言处理实验室联合开发的端侧大语言模型,非词嵌入参数量仅24亿(2.4B),支持128k上下文窗口。
MiniCPM是由面壁智能与清华大学自然语言处理实验室联合开源的一系列端侧大语言模型,核心语言模型MiniCPM-2B仅含24亿非词嵌入参数。
MiniCPM 是面壁智能与清华大学自然语言处理实验室共同开源的系列端侧语言大模型,主体语言模型 MiniCPM-2B 仅有 24亿(2.4B)的非词嵌入参数量。