面壁智能聯合清華大學及OpenBMB開源社區發佈新一代端側多模態大模型MiniCPM-V4.6,僅1.3B參數,推出Instruct與Thinking兩個版本,憑藉高智能密度與跨平臺適配能力,在多項評測中表現超越更大參數模型,加速端側AI應用落地。
面壁智能聯合清華大學、OpenBMB開源社區,發佈並開源了低比特大模型訓練成果BitCPM-CANN,在華爲昇騰平臺原生完成。該成果包含0.5B至8B四個模型尺寸,性能優異,能釋放六倍顯存紅利,顯著推動端側AI大模型的輕量化與工程落地。
面壁智能聯合清華大學及OpenBMB開源社區,發佈並開源了中國首個基於華爲昇騰平臺訓練的三值(1.58-bit)大模型BitCPM-CANN。該模型在低比特訓練領域取得突破,實現從量化算子到訓練算法的全鏈路原生開發,推出0.5B至8B四個尺寸版本,展示了國產算力平臺的強大實力。
面壁智能聯合清華大學及OpenBMB開源社區發佈MiniCPM-V 4.6端側多模態大模型,僅1.3B參數、6G內存即可流暢運行,性能卓越,在內存漲價背景下實現“低內存、極速跑”,爲AI應用拓展新可能。
openbmb
MiniCPM4.1-8B-GGUF是MiniCPM4.1-8B模型的GGUF量化格式版本,專為端側設備設計的高效大語言模型,採用80億參數,支持融合思維,在典型端側芯片上可實現超過5倍的生成加速。
MiniCPM4 是一款專為端側設備設計的高效大語言模型,在相同規模下保持最優性能的同時實現了極致的效率提升,在典型端側芯片上可實現超 5 倍的生成加速。
AyyYOO
MiniCPM4-8B-Q8_0-GGUF 是通過 llama.cpp 將 openbmb/MiniCPM4-8B 轉換為 GGUF 格式的模型,適用於本地推理。
MiniCPM4是專為端側設備設計的高效大語言模型,在相同規模下實現了極致的效率提升和最優性能。
MiniCPM4-MCP是一款開源的端側大語言模型智能體模型,基於80億參數的MiniCPM-4構建,能夠通過MCP與各種工具和數據資源交互,解決廣泛的現實世界任務。
MiniCPM4是專為端側設備設計的高效大語言模型,通過系統創新在模型架構、訓練數據、訓練算法和推理系統四個關鍵維度實現極致的效率提升。
MiniCPM4是專為端側設備設計的高效大語言模型,通過系統創新在模型架構、訓練數據、訓練算法和推理系統四個維度實現極致效率提升,在端側芯片上可實現超5倍的生成加速。
AgentCPM-GUI是一款具備RFT增強推理能力的設備端圖形界面代理,可操作中英文應用,基於80億參數的MiniCPM-V構建。
MiniCPM-S-1B-sft 是一個基於激活稀疏化技術優化的1B參數規模語言模型,通過ProSparse方法實現高稀疏性推理加速,同時保持與原始模型相當的性能。
該模型在多箇中文和英文數據集上進行了測試,包括語義文本相似度和分類任務。
MiniCPM-o 2.6的int4量化版本,顯著降低GPU顯存佔用,支持多模態處理能力。
MiniCPM-o 2.6是一個多模態模型,支持視覺和語言任務,專為llama.cpp設計。
MiniCPM-o 2.6是一款手機端運行的GPT-4o級多模態大模型,支持視覺、語音與直播流處理
VisRAG是基於視覺語言模型(VLM)的檢索增強生成(RAG)系統,可直接將文檔作為圖像進行嵌入表徵,避免傳統文本解析導致的信息損耗。
MiniCPM-重排序器是由面壁智能與清華大學自然語言處理實驗室、東北大學信息檢索小組聯合研發的中英雙語文本重排序模型,具備卓越的中英文及跨語言重排序能力。
MiniCPM-Embedding 是基於 MiniCPM-2B-sft-bf16 基礎模型開發的嵌入模型,專注於檢索任務,支持中英文雙語。
MiniCPM3-4B是MiniCPM系列第三代模型,整體性能超越Phi-3.5-mini-Instruct和GPT-3.5-Turbo-0125,與近期多個7B~9B量級模型表現相當。
MiniCPM-V是一個手機端GPT-4V級多模態大語言模型,支持單圖、多圖與視頻理解,具備視覺、光學字符識別等功能。
MiniCPM-V 2.6是一個多模態視覺語言模型,支持圖像文本到文本的轉換,具備多語言處理能力。
MiniCPM-Llama3-V 2.5的int4量化版本,顯著降低GPU顯存佔用至約9GB,適用於視覺問答任務。