面壁智能联合清华大学及OpenBMB开源社区发布MiniCPM-V 4.6端侧多模态大模型,仅1.3B参数、6G内存即可流畅运行,性能卓越,在内存涨价背景下实现“低内存、极速跑”,为AI应用拓展新可能。
开源AI社区发布多模态大语言模型MiniCPM-V4.5,专为智能手机和平板等端侧设备优化。该模型仅8亿参数,轻量化设计实现高效运行,在OpenCompass评估中获77.2分,性能领先同类开源模型,为移动端AI应用开辟新可能。
面壁智能联合清华大学发布端侧多模态大模型MiniCPM-V4.5,采用SigLIP2-400M视觉模块与MiniCPM4架构,以更小参数实现更强性能,显著提升边缘AI部署效率和应用广度,推动端侧多模态技术发展。
MiniCPM-V4.0人工智能模型引发关注,这款4.1亿参数的新模型在视觉理解方面表现优异,OpenCompass评测得分69.0超越多款竞品。其最大亮点是专为移动设备优化,在iPhone16Pro Max上响应迅速且无发热问题。开发团队提供了iOS应用和详细指南,支持多种平台工具,让用户轻松上手使用。
高性能多模态语言模型,适用于图像和视频理解。
openbmb
AgentCPM-GUI是一款具备RFT增强推理能力的设备端图形界面代理,可操作中英文应用,基于80亿参数的MiniCPM-V构建。
FriendliAI
MiniCPM-V 2.6是一款强大的多模态大语言模型,能够在手机等设备上高效运行,支持单图像、多图像和视频理解任务。
c01zaut
MiniCPM-V 2.6是支持单图、多图和视频理解的GPT-4V级别多模态大语言模型,专为RK3588 NPU优化
AI-Engine
MiniCPM-V-2_6的GGUF量化版本,基于llama.cpp实现高效图像文本转换
jchevallard
MiniCPM-V 2.6是MiniCPM-V系列最新最强的多模态大模型,支持单图、多图和视频理解,具有领先的性能和极致效率。
gaianet
MiniCPM-V-2_6 是一个视觉问答模型,支持中英文,专注于处理视觉相关的问答任务。
MiniCPM-V是一个手机端GPT-4V级多模态大语言模型,支持单图、多图与视频理解,具备视觉、光学字符识别等功能。
MiniCPM-V 2.6是一个多模态视觉语言模型,支持图像文本到文本的转换,具备多语言处理能力。
RhapsodyAI
免OCR的视觉文档嵌入模型,能够通过图像理解文档内容并生成表示向量,适用于文本和视觉密集型文档检索。
MiniCPM-V 2.6是OpenBMB推出的多模态大模型,在单图、多图及视频理解任务上超越GPT-4V,支持iPad端实时视频理解。
MiniCPM-V 2.0是面向高效终端部署的强大多模态大语言模型,基于SigLip-400M和MiniCPM-2.4B构建,通过感知器重采样器连接。
MiniCPM-V是一款高效轻量级多模态模型,专为终端设备部署优化,支持中英双语交互,性能超越同规模模型。