Com o desenvolvimento contínuo da inteligência artificial, um novo modelo chamado MiniCPM-V4.0 chamou a atenção recentemente. Este modelo é a versão mais recente da série MiniCPM-V, com 410 milhões de parâmetros, construído com base no SigLIP2-400M e no MiniCPM4-3B. Em comparação com versões anteriores, o MiniCPM-V4.0 demonstra um desempenho excelente em compreensão de imagem única, múltiplas imagens e vídeos, além de ter uma melhoria significativa em eficiência.
O MiniCPM-V4.0 se orgulha de suas fortes capacidades visuais. Em diversos benchmarks de avaliação, este modelo obteve uma pontuação média de 69,0 no teste abrangente do OpenCompass, superando modelos como GPT-4.1-mini-20250414, MiniCPM-V2.6 (com 810 milhões de parâmetros, pontuação 65,2) e Qwen2.5-VL-3B-Instruct (com 380 milhões de parâmetros, pontuação 64,5). Na área de compreensão de múltiplas imagens e vídeos, também mostrou bom desempenho.
O design voltado para dispositivos móveis é uma das principais vantagens do MiniCPM-V4.0. O modelo funciona suavemente no iPhone 16 Pro Max, com tempo de resposta inicial inferior a 2 segundos, velocidade de decodificação superior a 17 tokens por segundo e sem problemas de aquecimento. Mesmo sob altas demandas simultâneas, ele demonstra uma capacidade de throughput superior.
Para permitir que mais usuários tenham facilidade em usar, o MiniCPM-V4.0 oferece várias formas de uso, incluindo ferramentas compatíveis com diversas plataformas, como llama.cpp, Ollama, vLLM, entre outras. Para melhor atender aos usuários, a equipe de desenvolvimento também disponibilizou um aplicativo iOS de código aberto que pode ser executado no iPhone e iPad, ajudando os usuários a começar facilmente. O Cookbook complementar também fornece um guia detalhado e exemplos práticos, simplificando ainda mais o processo de operação.
Projeto: https://huggingface.co/openbmb/MiniCPM-V-4
Principais pontos:
🌟 O MiniCPM-V4.0 obteve 69,0 na avaliação do OpenCompass, superando vários modelos concorrentes.
📱 Este modelo foi projetado especificamente para dispositivos móveis, com resposta rápida e sem problema de aquecimento.
📚 Aplicativo iOS de código aberto e guia detalhado de uso, tornando mais fácil para os usuários iniciarem.