Avec le développement continu de l'intelligence artificielle, le nouveau modèle MiniCPM-V4.0 a récemment attiré une grande attention. Ce modèle est la dernière version de la série MiniCPM-V, comprenant 410 millions de paramètres et construit sur la base de SigLIP2-400M et MiniCPM4-3B. Par rapport aux versions précédentes, MiniCPM-V4.0 se distingue par ses performances dans la compréhension d'une seule image, de plusieurs images et de vidéos, ainsi qu'une amélioration significative en termes d'efficacité.

image.png

MiniCPM-V4.0 s'organe de ses fortes capacités visuelles. Dans de nombreux benchmarks, ce modèle a obtenu une moyenne de 69,0 dans l'évaluation globale d'OpenCompass, surpassant GPT-4.1-mini-20250414, MiniCPM-V2.6 (810 millions de paramètres, score 65,2) et Qwen2.5-VL-3B-Instruct (380 millions de paramètres, score 64,5). Dans les domaines de la compréhension des images multiples et des vidéos, il démontre également de bonnes performances.

La conception adaptée aux appareils mobiles est un point fort de MiniCPM-V4.0. Ce modèle fonctionne sans problème sur l'iPhone 16 Pro Max, avec un délai de première réponse inférieur à 2 secondes, une vitesse de décodage supérieure à 17 tokens par seconde, et aucune surchauffe. Même sous un grand nombre de requêtes simultanées, il présente une capacité de traitement supérieure.

Pour permettre à plus d'utilisateurs de commencer facilement, MiniCPM-V4.0 propose plusieurs méthodes d'utilisation, y compris des outils compatibles avec divers plateformes comme llama.cpp, Ollama et vLLM. Pour mieux servir les utilisateurs, l'équipe de développement a également rendu open source une application iOS pouvant fonctionner sur l'iPhone et l'iPad, aidant ainsi les utilisateurs à démarrer facilement. Le Cookbook associé fournit également des instructions détaillées et des exemples pratiques, simplifiant davantage le processus d'utilisation.

Projet : https://huggingface.co/openbmb/MiniCPM-V-4

Points clés :

🌟 MiniCPM-V4.0 a obtenu un score de 69,0 dans l'évaluation d'OpenCompass, surpassant plusieurs modèles concurrents.

📱 Ce modèle est conçu spécifiquement pour les appareils mobiles, avec une réponse rapide et sans surchauffe.

📚 Une application iOS open source et des guides d'utilisation détaillés facilitent l'utilisation du modèle.