MiniCPM-V4.0 lançado de forma aberta, considerado o GPT-4V para celulares

AIbase基地

Publicado emNotícias e Informações de IA · 5 minutos de leitura · Aug 7, 2025

A equipe OpenBMB anunciou recentemente a liberação oficial da nova versão de modelo multivisual MiniCPM-V4.0. Com sua arquitetura leve e desempenho excepcional, esse modelo é chamado de "GPT-4V no celular", prometendo uma revolução nas aplicações de inteligência artificial nos dispositivos móveis.

O núcleo do MiniCPM-V4.0 está em seu design sofisticado. Ele é baseado em SigLIP2-400M e MiniCPM4-3B, com apenas 4,1B parâmetros, mas demonstra uma capacidade notável na compreensão de imagens, múltiplas imagens e vídeos. Isso permite que ele processe facilmente uma única imagem, bem como compreenda conteúdo complexo relacionado a múltiplas imagens e trechos de vídeo, oferecendo uma experiência de interação mais inteligente para os usuários.

Ainda que tenha um número reduzido de parâmetros, o desempenho do MiniCPM-V4.0 é impressionante. Em oito benchmarks principais do OpenCompass, o modelo obteve uma média de 69,0, superando concorrentes como GPT-4.1-mini e Qwen2.5-VL-3B. Esses resultados provam sua força na compreensão visual, especialmente na análise precisa e profunda de cenários complexos.

Outro destaque do MiniCPM-V4.0 é sua otimização intensiva para dispositivos móveis. Testes no novo iPhone16Pro Max mostraram que o tempo de resposta inicial foi inferior a 2 segundos, a velocidade de decodificação ultrapassou 17 token por segundo, e o aquecimento do dispositivo foi controlado eficientemente durante a execução, garantindo uma experiência suave e estável. Além disso, ele pode lidar com solicitações simultâneas, sendo ideal para aplicações reais em dispositivos de borda como celulares e tablets.

Para reduzir a barreira de uso, a equipe OpenBMB fornece suporte abrangente. O MiniCPM-V4.0 é compatível com frameworks principais como llama.cpp, Ollama e vllm_project, oferecendo opções flexíveis para implantação. A equipe também desenvolveu especificamente um aplicativo iOS, que permite executá-lo diretamente em iPhone e iPad, além de publicar um Cookbook detalhado com tutoriais completos e exemplos de código.

A liberação do MiniCPM-V4.0 abre novas possibilidades para a aplicação de tecnologias multivisuais. Suas principais aplicações incluem:

Análise de imagens e conversas em múltiplas etapas: Os usuários podem carregar imagens, permitindo que o modelo analise seu conteúdo e continue a conversa com base nisso.
Comprensão de vídeos: É capaz de analisar o conteúdo dos vídeos, fornecendo soluções para cenários que exigem processamento de informações visuais.
OCR e raciocínio matemático: O modelo possui capacidade de reconhecer textos em imagens e resolver problemas matemáticos, aumentando significativamente sua utilidade prática no trabalho e estudo.

A liberação do MiniCPM-V4.0 não apenas demonstra a excelente capacidade das equipes de IA chinesas no desenvolvimento de modelos leves, mas também fornece uma poderosa ferramenta para desenvolvedores globais explorarem a tecnologia multivisual em dispositivos móveis, avançando significativamente na democratização da inteligência artificial.

MiniCPM-V 4.0, novo modelo multimodal da FaceWall Intelligence, é aberto ao público

A comunidade ModelScope anunciou oficialmente o MiniCPM-V 4.0, o novo modelo multimodal da FaceWall Intelligence. Com 4B parâmetros, esse modelo obteve resultados de estado da arte (SOTA) em vários rankings, como OpenCompass, OCRBench e MathVista, e também conseguiu operar de forma estável e fluida em dispositivos móveis como celulares. Além disso, a equipe oficial também disponibilizou ferramentas para implantação e inferência do MiniCPM-V.

A Facewall Intelligence lança o MiniCPM 4.0, um modelo lateral de grande porte que pode proporcionar uma melhoria de 220 vezes na velocidade

Em 6 de junho, a Facewall Intelligence lançou oficialmente sua mais nova obra-prima - a série de modelos MiniCPM 4.0, considerada a 'pequena arma poderosa' mais imaginativa de todos os tempos. A série não apenas realiza um salto em desempenho lateral, mas também estabelece um novo padrão de inovação tecnológica. A série MiniCPM 4.0 inclui dois produtos de grande destaque: um é a versão rara de 8B, que causou uma tempestade de eficiência com sua inovadora arquitetura esparça; e outra é a versão leve de apenas 0,5B, conhecida como a 'menor pequena arma poderosa'. Esses dois modelos alcançam avanços significativos em velocidade, eficiência, desempenho e implementação.

Pixverse lança atualização V4.0: sincronização de áudio e recurso de reestilização impressionam

A ferramenta de geração de vídeo com inteligência artificial Pixverse lançou oficialmente sua versão V4.0, uma atualização descrita pelos usuários como "assustadoramente poderosa". De acordo com as últimas notícias na plataforma X, o Pixverse V4.0 não apenas aprimorou significativamente o modelo subjacente, mas também adicionou a geração de áudio sincronizada e um recurso de reestilização estável, abrindo novas possibilidades para criadores de conteúdo. Um dos destaques mais notáveis desta atualização é o recurso de reestilização. O usuário do X @toto2AI exibiu um vídeo, afirmando que...

OpenBMB lança o modelo multi-modal MiniCPM-o2.6: processamento de visão e voz agora também em smartphones

Nos últimos anos, a inteligência artificial (IA) tem apresentado avanços significativos, mas ainda existem desafios na conciliação entre eficiência computacional e multifuncionalidade. Muitos modelos multimodais avançados, como o GPT-4, geralmente exigem recursos computacionais substanciais, o que limita seu uso a servidores de alta capacidade, dificultando a utilização eficaz de tecnologias de inteligência em dispositivos de borda, como smartphones e tablets. Além disso, o processamento em tempo real de tarefas como análise de vídeo ou conversão de voz para texto ainda enfrenta obstáculos tecnológicos, destacando a necessidade de modelos de IA eficientes e flexíveis para permitir uma operação perfeita em condições de hardware limitadas.

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

GEO Brand Visibility

AI Brand Monitoring Tool

AI Search Visibility Checker

GEO Promotion Link Detection

GEO Ranking Optimization System

GEO Services​

AI Model Compatibility Checker

AI Deployment Calculator

MiniCPM-V4.0 lançado de forma aberta, considerado o GPT-4V para celulares

AIbase基地

Este artigo é do AIbase Daily

Notícias de IA Relacionadas Recomendadas

Jingdong lança com destaque um motor de raciocínio xLLM impulsionado por chips nacionais

O modelo de multimídia de código aberto MiniCPM-V 4.5 é lançado, com 8 bilhões de parâmetros para implantação de IA em dispositivos móveis

Celulares também podem rodar! A Mian CPV lança oficialmente MiniCPM-V4.5 com 410 milhões de parâmetros que superam o GPT-4.1-mini

Modelo de visão MiniCPM-V 4.0, aplicativo para smartphone mais suave

MiniCPM-V 4.0, novo modelo multimodal da FaceWall Intelligence, é aberto ao público

Jornal AI: Alibaba lança novo modelo de imagem Qwen-Image; Zread.ai da Zhigpu é equipado com GLM-4.5; Claude Opus 4.1 pode iniciar a fase de teste interno

A Facewall Intelligence lança o MiniCPM 4.0, um modelo lateral de grande porte que pode proporcionar uma melhoria de 220 vezes na velocidade

OpenBMB Junqi Entra em Serviço! Revolucionando a Geração de Textos Longos e Desafiando o Modelo Tradicional de Resumos

Pixverse lança atualização V4.0: sincronização de áudio e recurso de reestilização impressionam

OpenBMB lança o modelo multi-modal MiniCPM-o2.6: processamento de visão e voz agora também em smartphones

Notícias de IA Relacionadas Recomendadas

Jingdong lança com destaque um motor de raciocínio xLLM impulsionado por chips nacionais

O modelo de multimídia de código aberto MiniCPM-V 4.5 é lançado, com 8 bilhões de parâmetros para implantação de IA em dispositivos móveis

Celulares também podem rodar! A Mian CPV lança oficialmente MiniCPM-V4.5 com 410 milhões de parâmetros que superam o GPT-4.1-mini

Modelo de visão MiniCPM-V 4.0, aplicativo para smartphone mais suave

MiniCPM-V 4.0, novo modelo multimodal da FaceWall Intelligence, é aberto ao público

Jornal AI: Alibaba lança novo modelo de imagem Qwen-Image; Zread.ai da Zhigpu é equipado com GLM-4.5; Claude Opus 4.1 pode iniciar a fase de teste interno

A Facewall Intelligence lança o MiniCPM 4.0, um modelo lateral de grande porte que pode proporcionar uma melhoria de 220 vezes na velocidade

OpenBMB Junqi Entra em Serviço! Revolucionando a Geração de Textos Longos e Desafiando o Modelo Tradicional de Resumos

Pixverse lança atualização V4.0: sincronização de áudio e recurso de reestilização impressionam

OpenBMB lança o modelo multi-modal MiniCPM-o2.6: processamento de visão e voz agora também em smartphones

GEO Services