InternVL2.5-MPO एक उन्नत बहुविध विशाल भाषा मॉडल श्रृंखला है, जो InternVL2.5 और मिश्रित प्राथमिकता अनुकूलन पर आधारित है। इस मॉडल में वृद्धिशील पूर्व-प्रशिक्षित InternViT और विभिन्न पूर्व-प्रशिक्षित विशाल भाषा मॉडल जैसे InternLM 2.5 और Qwen 2.5 को शामिल किया गया है, जो यादृच्छिक रूप से इनिशियलाइज़्ड MLP प्रोजेक्टर का उपयोग करते हैं। यह बहु-छवियों और वीडियो डेटा का समर्थन करता है और बहुविध कार्यों में उत्कृष्ट प्रदर्शन करता है, छवि से संबंधित पाठ सामग्री को समझने और उत्पन्न करने में सक्षम है।