मॉडल स्कोप समुदाय ने घोषणा की कि मिनीसीपीएम-वी4.0, एक नई पीढ़ी के बहुमाध्यमिक मॉडल को खुला स्रोत बना दिया गया है। 4 बिलियन पैरामीटर के साथ, यह मॉडल ओपनकॉम्पस, ओसीआरबेंच, मैथविस्टा आदि कई रैंकिंग पर इस श्रेणी में सबसे अच्छा प्रदर्शन (SOTA) रखता है और फोन जैसे मोबाइल उपकरणों पर स्थिर और चलता रहता है। साथ ही, आधिकारिक रूप से डेवलपर्स के लिए एक अनुमान डेप्लॉयमेंट टूल मिनीसीपीएम-वी कुकबुक भी खुला स्रोत बनाया गया है, जो अलग-अलग आवश्यकताओं, अलग-अलग स्थितियों और अलग-अलग उपकरणों पर आसान और हल्का डेप्लॉयमेंट करने में मदद करता है।
मिनीसीपीएम-वी4.0 के खुला स्रोत होने से बहुमाध्यमिक मॉडल के डिवाइस पर उपयोग के क्षेत्र में महत्वपूर्ण कदम उठाया गया है। फोन पर चलने वाले मॉडल के आकार के रूप में, मिनीसीपीएम-वी4.0 ने 4 बिलियन पैरामीटर के साथ स्थिर चलने और तेजी से प्रतिक्रिया देने में सफलता प्राप्त की, लंबे समय तक लगातार उपयोग करने पर भी गर्म होने या लगातार रुक जाने की समस्या नहीं होती है। अब, मिनीसीपीएम-वी4.0 के स्थानीय डेप्लॉयमेंट के लिए iOS ऐप खुला स्रोत है, जिसे कुकबुक में डाउनलोड करके उपयोग किया जा सकता है।
क्षमता के मामले में, मिनीसीपीएम-वी4.0 ने 4 बिलियन पैरामीटर वर्ग में बहुमाध्यमिक क्षमता में एक श्रेणी में सबसे अच्छा प्रदर्शन रखा है। ओपनकॉम्पस, ओसीआरबेंच, मैथविस्टा, एमएमवीटी, एमएमबेंच वी1.1, एमएमस्टार, एआई2डी, हैलूशनबेंच आदि मूल्यांकन मानक परीक्षण में, मिनीसीपीएम-वी4.0 की समग्र क्षमता श्रेणी में सबसे ऊंचा है। विशेष रूप से ओपनकॉम्पस मूल्यांकन में, मिनीसीपीएम-वी4.0 की समग्र क्षमता क्वेन2.5-वीएल3बी मॉडल और इंटर्नवीएल2.54बी मॉडल से अधिक है, यहां तक कि जीपीटी-4.1-मिनी और क्लॉड3.5सॉनेट के समान है। पिछले मिनीसीपीएम-वी2.6 के 8बी मॉडल की तुलना में, मिनीसीपीएम-वी4.0 में पैरामीटर आकार आधा हो गया है, लेकिन बहुमाध्यमिक क्षमता में उल्लेखनीय सुधार हुआ है।
मिनीसीपीएम-वी4.0 फोन, पीसी आदि डिवाइस पर वीडियो अनुमान, चित्र अनुमान आदि कार्यों को चलाने में बहुत चलता रहता है और चलता रहता है, इसके अलावा इसके उत्कृष्ट प्रदर्शन के अलावा, इसके विशिष्ट मॉडल संरचना डिज़ाइन के कारण है। इस डिज़ाइन ने समान आकार के मॉडल में सबसे तेज पहली प्रतिक्रिया समय और कम ग्राफिक्स मेमोरी उपयोग के साथ बनाया है। Apple M4Metal पर परीक्षण के बाद, मिनीसीपीएम-वी4.0 मॉडल के साथ सामान्य चलाने में ग्राफिक्स मेमोरी का उपयोग केवल 3.33 जीबी है, जो Qwen2.5-VL3B, Gemma3-4B आदि मॉडल से कम है। चित्र अनुमान परीक्षण में, मिनीसीपीएम-वी4.0 ANE + Metal सहायता त्वरण के साथ, पहली प्रतिक्रिया समय बहुत कम हो गया, जैसे-जैसे इनपुट चित्र के भेदभाव के स्तर में वृद्धि होती है, पहली प्रतिक्रिया समय में तेजी का फायदा अधिक उल्लेखनीय हो जाता है।
इसके अलावा, अनुसंधान टीम ने 2 4090 ग्राफिक्स कार्डों का उपयोग करके मॉडल के समानांतरता और बैंडविड्थ के आकलन के लिए परीक्षण किया। परीक्षण परिणामों से पता चलता है कि संसाधन क्षमता द्वारा समर्थित होने पर, समानांतरता के बढ़ने के साथ, मिनीसीपीएम-वी4.0 मॉडल के कुल बैंडविड्थ लाभ अधिक उल्लेखनीय हो जाता है। उदाहरण के लिए, 256 समानांतर उपयोगकर्ता के आवेदन में, मिनीसीपीएम-वी4.0 के बैंडविड्थ लगभग 13856 tokens/s है, जो Qwen2.5-VL के 7153 tokens/s और Gemma3 के 7607 tokens/s से बहुत अधिक है।
गिटहब: 🔗 https://github.com/OpenBMB/MiniCPM-o
हफिंग फेस: 🔗 https://huggingface.co/openbmb/MiniCPM-V-4
मॉडल स्कोप: 🔗 https://modelscope.cn/models/OpenBMB/MiniCPM-V-4
कुकबुक: 🔗 https://github.com/OpenSQZ/MiniCPM-V-CookBook