Nouveau benchmark MathVerse pour les modèles linguistiques multimodaux

Le site web "站长之家" a rapporté l'arrivée d'un nouveau benchmark nommé MathVerse, conçu pour évaluer les performances des grands modèles linguistiques multimodaux (MLLMs) sur des problèmes mathématiques visuels. L'étude a révélé que la plupart des modèles dépendent fortement des entrées visuelles, mais que GPT-4V excelle tant au niveau textuel que visuel.

Le lancement de ce benchmark offre de nouvelles perspectives pour le développement futur des MLLMs.