面壁智能联合清华大学及OpenBMB开源社区发布新一代端侧多模态大模型MiniCPM-V4.6,仅1.3B参数,推出Instruct与Thinking两个版本,凭借高智能密度与跨平台适配能力,在多项评测中表现超越更大参数模型,加速端侧AI应用落地。
面壁智能联合清华大学、OpenBMB开源社区,发布并开源了低比特大模型训练成果BitCPM-CANN,在华为昇腾平台原生完成。该成果包含0.5B至8B四个模型尺寸,性能优异,能释放六倍显存红利,显著推动端侧AI大模型的轻量化与工程落地。
面壁智能联合清华大学及OpenBMB开源社区,发布并开源了中国首个基于华为昇腾平台训练的三值(1.58-bit)大模型BitCPM-CANN。该模型在低比特训练领域取得突破,实现从量化算子到训练算法的全链路原生开发,推出0.5B至8B四个尺寸版本,展示了国产算力平台的强大实力。
面壁智能联合清华大学及OpenBMB开源社区发布MiniCPM-V 4.6端侧多模态大模型,仅1.3B参数、6G内存即可流畅运行,性能卓越,在内存涨价背景下实现“低内存、极速跑”,为AI应用拓展新可能。
openbmb
VoxCPM是一款创新的免分词器端到端文本转语音(TTS)系统,通过在连续空间中对语音进行建模,克服了离散分词的局限性。它具备上下文感知语音生成和逼真零样本语音克隆两大核心能力,能够根据文本内容自动调整韵律和风格,并仅需一个简短的参考音频即可克隆说话者的音色、口音和情感。
MiniCPM4.1-8B-GGUF是MiniCPM4.1-8B模型的GGUF量化格式版本,专为端侧设备设计的高效大语言模型,采用80亿参数,支持融合思维,在典型端侧芯片上可实现超过5倍的生成加速。
MiniCPM4 是一款专为端侧设备设计的高效大语言模型,在相同规模下保持最优性能的同时实现了极致的效率提升,在典型端侧芯片上可实现超 5 倍的生成加速。
AyyYOO
MiniCPM4-8B-Q8_0-GGUF 是通过 llama.cpp 将 openbmb/MiniCPM4-8B 转换为 GGUF 格式的模型,适用于本地推理。
MiniCPM4是专为端侧设备设计的高效大语言模型,在相同规模下实现了极致的效率提升和最优性能。
MiniCPM4-MCP是一款开源的端侧大语言模型智能体模型,基于80亿参数的MiniCPM-4构建,能够通过MCP与各种工具和数据资源交互,解决广泛的现实世界任务。
MiniCPM4是专为端侧设备设计的高效大语言模型,通过系统创新在模型架构、训练数据、训练算法和推理系统四个关键维度实现极致的效率提升。
MiniCPM4是专为端侧设备设计的高效大语言模型,通过系统创新在模型架构、训练数据、训练算法和推理系统四个维度实现极致效率提升,在端侧芯片上可实现超5倍的生成加速。
AgentCPM-GUI是一款具备RFT增强推理能力的设备端图形界面代理,可操作中英文应用,基于80亿参数的MiniCPM-V构建。
MiniCPM-S-1B-sft 是一个基于激活稀疏化技术优化的1B参数规模语言模型,通过ProSparse方法实现高稀疏性推理加速,同时保持与原始模型相当的性能。
该模型在多个中文和英文数据集上进行了测试,包括语义文本相似度和分类任务。
MiniCPM-o 2.6的int4量化版本,显著降低GPU显存占用,支持多模态处理能力。
MiniCPM-o 2.6是一个多模态模型,支持视觉和语言任务,专为llama.cpp设计。
MiniCPM-o 2.6是一款手机端运行的GPT-4o级多模态大模型,支持视觉、语音与直播流处理
VisRAG是基于视觉语言模型(VLM)的检索增强生成(RAG)系统,可直接将文档作为图像进行嵌入表征,避免传统文本解析导致的信息损耗。
MiniCPM-重排序器是由面壁智能与清华大学自然语言处理实验室、东北大学信息检索小组联合研发的中英双语文本重排序模型,具备卓越的中英文及跨语言重排序能力。
MiniCPM-Embedding 是基于 MiniCPM-2B-sft-bf16 基础模型开发的嵌入模型,专注于检索任务,支持中英文双语。
MiniCPM3-4B是MiniCPM系列第三代模型,整体性能超越Phi-3.5-mini-Instruct和GPT-3.5-Turbo-0125,与近期多个7B~9B量级模型表现相当。
MiniCPM-V是一个手机端GPT-4V级多模态大语言模型,支持单图、多图与视频理解,具备视觉、光学字符识别等功能。
MiniCPM-V 2.6是一个多模态视觉语言模型,支持图像文本到文本的转换,具备多语言处理能力。