28 अगस्त को प्रकाशित चीनी मल्टीमीडिया विजुअल लैंग्वेज मॉडल मूल्यांकन बेंचमार्क (SuperCLUE-VLM) सूची में, Gemini-2.5-Pro 74.99 अंकों के साथ शीर्ष पर है, जबकि OpenAI के GPT-5 (high) 68.59 अंकों के साथ दूसरे स्थान पर है।

image.png

यह बेंचमार्क चीनी स्थिति के विशेषताओं पर आधारित है, और आधारभूत ज्ञान, दृश्य तर्क और दृश्य अनुप्रयोग तीन मुख्य आयामों पर आधारित मूल्यांकन प्रणाली बनाता है, जो बहुमाध्यमिक विजुअल भाषा मॉडल के विकास के लिए वस्तुनिष्ठ और न्यायसंगत मानक प्रदान करने के लिए लक्ष्य रखता है।

इस मूल्यांकन में कुल 15 बहुमाध्यमिक मॉडल शामिल हैं, जैसे कि Claude-Opus-4.1, Gemini-2.5-Pro, GPT-5 (high), ERNIE-4.5-Turbo-VL, Doubao-Seed-1.6-thinking, hunyuan-t1-vision, Qwen-V1-Max-Latest, जो घरेलू और विदेशी प्रमुख मॉडल शामिल हैं।

image.png

अंत में, Gemini-2.5-Pro 74.99 अंकों के साथ शीर्ष पर है, OpenAI के GPT-5 (high) 68.59 अंकों के साथ दूसरे स्थान पर है, जबकि बाइडू के ERNIE-4.5-Turbo-VL अन्य घरेलू मॉडल के साथ बराबर है, जो बाजार में मजबूत प्रतिस्पर्धा दर्शाता है।