कृत्रिम बुद्धिमत्ता के लगातार विकास में, हाल ही में एक नया मॉडल MiniCPM-V4.0 ध्यान आकर्षित कर रहा है। यह मॉडल MiniCPM-V श्रृंखला का अपडेटेड संस्करण है, जिसमें 41 करोड़ पैरामीटर हैं और इसे SigLIP2-400M और MiniCPM4-3B पर निर्मित किया गया है। पिछले संस्करण की तुलना में, MiniCPM-V4.0 एकल चित्र, बहुचित्र और वीडियो समझ में अच्छा प्रदर्शन करता है और दक्षता में भी बहुत सुधार हुआ है।

image.png

MiniCPM-V4.0 अपनी मजबूत दृश्य क्षमता के लिए गौरवान्वित है। विभिन्न मूल्यांकन मानकों में, इस मॉडल ने OpenCompass के समग्र मूल्यांकन में 69.0 का औसत अंक हासिल किया, जो GPT-4.1-mini-20250414, MiniCPM-V2.6 (81 करोड़ पैरामीटर, अंक 65.2) और Qwen2.5-VL-3B-Instruct (38 करोड़ पैरामीटर, अंक 64.5) को पार कर गया। बहुचित्र और वीडियो समझ के क्षेत्र में, इसने अच्छा प्रदर्शन भी दिखाया।

मोबाइल उपकरणों के लिए डिज़ाइन करना MiniCPM-V4.0 की एक प्रमुख विशेषता है। यह मॉडल iPhone16Pro Max पर सुचारू रूप से चलता है, पहली प्रतिक्रिया के लिए कम से कम 2 सेकंड का देरी होता है, और डिकोडिंग की गति प्रति सेकंड 17 टोकन से अधिक है, और गर्मी की समस्या नहीं होती। भले ही उच्च समानांतर अनुरोधों के तहत हो, यह अच्छी धारा क्षमता दिखाता है।

अधिक उपयोगकर्ताओं के लिए आसानी से शुरू करने के लिए, MiniCPM-V4.0 विभिन्न प्लेटफॉर्म के साथ संगत उपकरणों के साथ उपलब्ध है, जैसे llama.cpp, Ollama, vLLM आदि। उपयोगकर्ताओं की बेहतर सेवा के लिए, विकास टीम ने iPhone और iPad पर चलने वाले एक ओपन सोर्स iOS एप्लिकेशन भी ओपन सोर्स कर दिया है, जो उपयोगकर्ताओं को आसानी से शुरू करने में सहायता करता है। साथ ही, कूकबुक विस्तृत उपयोग निर्देश और उपयोगी उदाहरण प्रदान करता है, जो ऑपरेशन को आसान बनाता है।

परियोजना: https://huggingface.co/openbmb/MiniCPM-V-4

मुख्य बातें:

🌟 OpenCompass मूल्यांकन में MiniCPM-V4.0 का अंक 69.0 है, जो अन्य मॉडलों को पार कर गया है।  

📱 यह मॉडल मोबाइल उपकरणों के लिए डिज़ाइन किया गया है, जिसमें तेज प्रतिक्रिया है और गर्मी की समस्या नहीं है।  

📚 ओपन सोर्स iOS एप्लिकेशन और विस्तृत उपयोग निर्देश, जो उपयोगकर्ताओं को आसानी से शुरू करने में सहायता करते हैं।