Classement de l'évaluation du mois d'août de SuperCLUE pour les modèles multimodaux visuels : Gemini-2.5-Pro est en tête

AIbase基地

Publié leActualités IA · 2 minutes de lecture · Aug 29, 2025

Sur le classement du benchmark de modèles multimodaux visuels en chinois (SuperCLUE-VLM) publié le 28 août, Gemini-2.5-Pro se classe en tête avec un score total de 74,99 points, suivi par GPT-5 (high) d'OpenAI avec 68,59 points.

Ce benchmark a été construit autour des trois dimensions centrales de la compréhension fondamentale, du raisonnement visuel et de l'application visuelle, en tenant compte des caractéristiques spécifiques des scénarios en chinois, afin de fournir une norme d'évaluation objective et équitable pour le développement des modèles multimodaux visuels-langage.

Cette évaluation inclut au total 15 modèles multimodaux, notamment Claude-Opus-4.1, Gemini-2.5-Pro, GPT-5 (high), ERNIE-4.5-Turbo-VL, Doubao-Seed-1.6-thinking, hunyuan-t1-vision, Qwen-V1-Max-Latest, couvrant ainsi les principaux modèles nationaux et internationaux.

Au final, Gemini-2.5-Pro se classe en tête avec un score total de 74,99 points, GPT-5 (high) d'OpenAI est deuxième avec 68,59 points, tandis que ERNIE-4.5-Turbo-VL de Baidu se classe parmi les autres modèles nationaux, démontrant une forte compétitivité sur le marché.

SuperCLUE-VLM Gemini-2.5-Pro GPT-5 Modèle de langage multimodal

Cet article provient d'AIbase Daily

Bienvenue dans la section [AI Quotidien] ! Voici votre guide pour explorer le monde de l'intelligence artificielle chaque jour. Chaque jour, nous vous présentons les points forts du domaine de l'IA, en mettant l'accent sur les développeurs, en vous aidant à comprendre les tendances technologiques et à découvrir des applications de produits IA innovantes.

—— Créé par le groupe AIbase Daily

Recommandations d'actualités IA connexes

L'équipe AI de Xiaomi collabore avec l'Université de Pékin pour publier un nouveau papier. La jeune prodige, recrutée par Lei Jun, participe à la recherche

Xiaomi et l'Université de Pékin publient un article sur arXiv. Luo Fuli, auteure correspondante, diplômée de l'Université normale de Pékin, travaille à l'Institut de linguistique informatique de l'Université de Pékin.....

Oct 17, 2025

L'hôpital de l'Université Tsinghua et BDI ont collaboré pour développer le premier grand modèle en pharmacie en Chine : se concentrer sur l'évaluation de la sécurité des médicaments chez les groupes spéciaux

L'hôpital de l'Université Tsinghua à Pékin et BDI ont collaboré pour développer le premier grand modèle spécialisé en pharmacie en Chine, utilisant l'IA pour optimiser les processus pharmaceutiques, améliorer l'efficacité et la précision de l'évaluation de la sécurité des médicaments chez les personnes âgées, les enfants et les femmes enceintes, afin de répondre aux défis liés à l'actualisation rapide des informations sur les médicaments et aux différences individuelles complexes.

Oct 17, 2025

La création musicale par l'IA devient une activité secondaire pour les programmeurs : un single dépassant 2 millions de lectures, des revenus liés aux droits d'auteur de plusieurs dizaines de milliers de yuans

En 2025, les outils de création musicale par l'IA sont devenus courants, modifiant la structure de l'industrie. En janvier, un joueur de Genshin Impact a utilisé Suno pour créer une chanson qui a obtenu 6,4 millions de vues, ce qui a lancé un débat sur les capacités de création par l'IA. Les programmeurs sont devenus un groupe actif, et en mars, Yapie a produit une chanson thématique en quelques heures en utilisant plusieurs outils.

Oct 17, 2025

OpenAI suspend la génération de vidéos de Martin Luther King pour protéger l'image des personnalités historiques

OpenAI suspend Sora pour générer le portrait de Martin Luther King suite à une demande de sa succession, invoquant le contrôle des droits à l'image des personnalités publiques.....

Oct 17, 2025

L'équipe de Li Feifei présente RTFM : génération en temps réel d'un monde 3D avec une seule carte H100

RTFM de l'équipe Fei-Fei Li génère et interagit en temps réel avec des mondes 3D sur un seul GPU H100, assurant cohérence 3D, persistance et effets réalistes comme réflexions et ombres.....

Oct 17, 2025

Une phrase qui change la capacité de création en IA : une étude montre que des prompts simples peuvent améliorer significativement la diversité des sorties

Une équipe d'universités, notamment l'Université de Stanford, a proposé une méthode appelée « échantillonnage linguistique », consistant à demander au modèle de générer cinq réponses et leurs probabilités dans le prompt. Cette méthode améliore efficacement la diversité créative des systèmes d'IA générative. Elle est applicable aux modèles linguistiques et visuels, et peut stimuler des sorties plus riches en créativité.

Oct 17, 2025

Chongqing renforce la surveillance et retire plus de 10 produits d'IA en violation pour assurer la sécurité technologique

Chongqing supprime 10+ produits IA non conformes, dont 'prescriptions par IA'. La croissance rapide de l'IA souligne l'importance de la régulation face aux risques d'infox et de sécurité des données.....

Oct 17, 2025

Journal de l'IA : Gemini 3.0 Pro est envoyé en petite quantité ; Aishik Jing a levé 1 milliard de yuans pour sa série B+ ; Baidu lance un modèle d'analyse de document PaddleOCR-VL

Gemini 3.0 Pro en déploiement limité, améliore le raisonnement et le multimodal. Sortie prévue fin du mois. DeepMind améliore les performances IA.....

Oct 17, 2025

100

Journal de l'IA : ByteDance lance le modèle Pangu 1.6 ; Aishitechnology réalise un financement de série B+ de 100 millions de yuans ; Baidu lance le modèle de traitement de documents PaddleOCR-VL

ByteDance lance Doubao 1.6, premier modèle chinois à profondeur de réflexion ajustable, optimisant équilibre efficacité-qualité avec version allégée pour entreprises.....

Oct 17, 2025

La société de vidéos AI Aisite a levé 100 millions de yuans de financement de série B : ARR dépasse les 40 millions de dollars, plus d'un milliard d'utilisateurs

爱诗科技 lève 100 millions de yuans en série B+. Revenus annuels récurrents dépassent 40 millions USD avec 100 millions d'utilisateurs inscrits et 16 millions d'utilisateurs actifs mensuels. Croissance multipliée par 10 depuis la commercialisation en novembre 2024.....

Oct 17, 2025

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Submit Your Model

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

GEO Services

AI Search Visibility Checker

AI Model Compatibility Checker

AI Dataset Collection

Intelligent Document Recognition

Classement de l'évaluation du mois d'août de SuperCLUE pour les modèles multimodaux visuels : Gemini-2.5-Pro est en tête

AIbase基地

Cet article provient d'AIbase Daily

Recommandations d'actualités IA connexes

L'équipe AI de Xiaomi collabore avec l'Université de Pékin pour publier un nouveau papier. La jeune prodige, recrutée par Lei Jun, participe à la recherche

L'hôpital de l'Université Tsinghua et BDI ont collaboré pour développer le premier grand modèle en pharmacie en Chine : se concentrer sur l'évaluation de la sécurité des médicaments chez les groupes spéciaux

La création musicale par l'IA devient une activité secondaire pour les programmeurs : un single dépassant 2 millions de lectures, des revenus liés aux droits d'auteur de plusieurs dizaines de milliers de yuans

OpenAI suspend la génération de vidéos de Martin Luther King pour protéger l'image des personnalités historiques

L'équipe de Li Feifei présente RTFM : génération en temps réel d'un monde 3D avec une seule carte H100

Une phrase qui change la capacité de création en IA : une étude montre que des prompts simples peuvent améliorer significativement la diversité des sorties

Chongqing renforce la surveillance et retire plus de 10 produits d'IA en violation pour assurer la sécurité technologique

Journal de l'IA : Gemini 3.0 Pro est envoyé en petite quantité ; Aishik Jing a levé 1 milliard de yuans pour sa série B+ ; Baidu lance un modèle d'analyse de document PaddleOCR-VL

Journal de l'IA : ByteDance lance le modèle Pangu 1.6 ; Aishitechnology réalise un financement de série B+ de 100 millions de yuans ; Baidu lance le modèle de traitement de documents PaddleOCR-VL

La société de vidéos AI Aisite a levé 100 millions de yuans de financement de série B : ARR dépasse les 40 millions de dollars, plus d'un milliard d'utilisateurs

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Submit Your Model

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

GEO Services​

AI Search Visibility Checker

AI Model Compatibility Checker

AI Dataset Collection

Intelligent Document Recognition

Classement de l'évaluation du mois d'août de SuperCLUE pour les modèles multimodaux visuels : Gemini-2.5-Pro est en tête

AIbase基地

Cet article provient d'AIbase Daily

Recommandations d'actualités IA connexes

L'équipe AI de Xiaomi collabore avec l'Université de Pékin pour publier un nouveau papier. La jeune prodige, recrutée par Lei Jun, participe à la recherche

L'hôpital de l'Université Tsinghua et BDI ont collaboré pour développer le premier grand modèle en pharmacie en Chine : se concentrer sur l'évaluation de la sécurité des médicaments chez les groupes spéciaux

La création musicale par l'IA devient une activité secondaire pour les programmeurs : un single dépassant 2 millions de lectures, des revenus liés aux droits d'auteur de plusieurs dizaines de milliers de yuans

OpenAI suspend la génération de vidéos de Martin Luther King pour protéger l'image des personnalités historiques

L'équipe de Li Feifei présente RTFM : génération en temps réel d'un monde 3D avec une seule carte H100

Une phrase qui change la capacité de création en IA : une étude montre que des prompts simples peuvent améliorer significativement la diversité des sorties

Chongqing renforce la surveillance et retire plus de 10 produits d'IA en violation pour assurer la sécurité technologique

Journal de l'IA : Gemini 3.0 Pro est envoyé en petite quantité ; Aishik Jing a levé 1 milliard de yuans pour sa série B+ ; Baidu lance un modèle d'analyse de document PaddleOCR-VL

Journal de l'IA : ByteDance lance le modèle Pangu 1.6 ; Aishitechnology réalise un financement de série B+ de 100 millions de yuans ; Baidu lance le modèle de traitement de documents PaddleOCR-VL

La société de vidéos AI Aisite a levé 100 millions de yuans de financement de série B : ARR dépasse les 40 millions de dollars, plus d'un milliard d'utilisateurs

GEO Services