SuperCLUE Multimodale Visuelle August-Evaluierungsliste: Gemini-2.5-Pro belegt den ersten Platz

AIbase基地

Veröffentlicht amKI-Nachrichten und -Informationen · 2 Minuten Lesezeit · Aug 29, 2025

Im Ranking des chinesischen multimodalen visuellen Sprachmodells SuperCLUE-VLM, das am 28. August veröffentlicht wurde, belegte Gemini-2.5-Pro mit insgesamt 74,99 Punkten den ersten Platz, gefolgt von GPT-5 (high) von OpenAI mit 68,59 Punkten auf dem zweiten Platz.

Dieses Benchmark-System wurde auf Basis der Besonderheiten chinesischer Szenarien entwickelt und umfasst drei zentrale Dimensionen: grundlegende Wissensbildung, visuelle Schlussfolgerung und visuelle Anwendung. Es zielt darauf ab, einen objektiven und fairen Bewertungsstandard für die Entwicklung multimodaler visueller Sprachmodelle bereitzustellen.

In dieser Bewertung wurden insgesamt 15 multimodale Modelle wie Claude-Opus-4.1, Gemini-2.5-Pro, GPT-5 (high), ERNIE-4.5-Turbo-VL, Doubao-Seed-1.6-thinking, hunyuan-t1-vision und Qwen-V1-Max-Latest untersucht, wobei sowohl inländische als auch internationale führende Modelle vertreten sind.

Am Ende belegte Gemini-2.5-Pro mit insgesamt 74,99 Punkten den ersten Platz, gefolgt von GPT-5 (high) von OpenAI mit 68,59 Punkten auf dem zweiten Platz. Der ERNIE-4.5-Turbo-VL von Baidu erreichte mit anderen inländischen Modellen eine gemeinsame Position und zeigte damit eine starke Marktkompetitivität.

SuperCLUE-VLM Gemini-2.5-Pro GPT-5 Multimodale Visuelle Sprachmodelle

Dieser Artikel stammt aus dem AIbase-Tagesbericht

Willkommen im Bereich [KI-Tagesbericht]! Hier ist Ihr Leitfaden, um jeden Tag die Welt der künstlichen Intelligenz zu erkunden. Jeden Tag präsentieren wir Ihnen die Hotspots im KI-Bereich, konzentrieren uns auf Entwickler und helfen Ihnen, technologische Trends zu erkennen und innovative KI-Produktanwendungen zu verstehen.

—— Erstellt von der AIbase-Tagesberichtgruppe

Empfohlene verwandte KI-Nachrichten

Tagesbericht über KI: Visual China hat Zusammenarbeit mit mehreren großen Modellunternehmen geschlossen; OpenAI stoppt vorübergehend die Erstellung von verstorbenen Persönlichkeiten durch Sora; Google stellt Werkzeug zur Integration von Kartendaten des Gemini-Modells vor

Visual China kooperiert mit KI-Firmen für kommerzielles Bildmodell, bereits von Alibaba und Microsoft gebucht. Fokus auf Kreativbranche mit nachverfolgbaren Eigenschaften.....

Oct 20, 2025

Google stellt Werkzeug für die Integration von Gemini-Karten-Daten vor: KI kann Echtzeitdaten zu 250 Millionen Orten direkt abrufen

Google hat ein neues Werkzeug namens Grounding with Google Maps für die Gemini API vorgestellt, das KI und Karten-Daten tief integriert. Diese Funktion ermöglicht den Zugriff auf über 250 Millionen Standortinformationen, einschließlich Adressen und Öffnungszeiten, um geografische Antworten basierend auf echten Daten zu generieren. Wenn ein Benutzer eine Frage zu einem Ort stellt, kann Gemini automatisch Echtzeitdaten der Karte abrufen und beantworten.

Oct 20, 2025

Die mathematischen Leistungen von OpenAI GPT-5 werden angeblich übertrieben, was in der Technologiebranche zu debattieren auslöst

Kevin Weil, Vice President bei OpenAI, sagte, dass GPT-5 10 ungelöste mathematische Probleme von Erdős gelöst und 11 weiter vorangetrieben hat, was zur Kontroverse führte. Yann LeCun, Chef-Wissenschaftler für KI bei Meta, kritisierte dies als 'selbstgebastelt', und Demis Hassabis, CEO von Google DeepMind, äußerte sich verlegen. Das Ereignis zeigt, dass Vorsicht geboten ist, wenn es um die Behauptungen der Fähigkeiten von KI geht.

Oct 20, 2025

Google Gemini API bietet neue Fähigkeit zur Landmark-Erkennung, AI-Anwendungen werden plötzlich zu lokalen Experten

Google stellt eine neue Funktion des Gemini API namens Landmark-Erkennung vor, mit der Entwickler AI-Anwendungen direkt in Google Maps integrieren können, um auf über 250 Millionen Standortdaten zuzugreifen. Diese Funktion ermöglicht die automatische Erkennung geografischer Positionen bei Abfragen, das Extrahieren von Adressen, Öffnungszeiten und anderen Echtzeit-Strukturinformationen und verbessert die Entwicklungseffizienz von AI-Anwendungen mit Ortsbewusstsein erheblich.

Oct 20, 2025

Tagesbericht über KI: Google Gemini 3.0 Pro wird in kleinem Umfang bereitgestellt; Aishitechnology schließt eine Finanzierungsrunde der Stufe B+ über 100 Millionen Yuan ab; Baidu veröffentlicht ein Modell zur Dokumentenanalyse PaddleOCR-VL

Google Gemini 3.0 Pro startet eingeschränkten Rollout mit verbessertem Reasoning und Multimodalität. Offizielle Veröffentlichung Ende des Monats geplant. DeepMind optimiert KI-Leistung schrittweise.....

Oct 17, 2025

Sora 2 von OpenAI ist nun auf der Microsoft Azure-Plattform verfügbar: Preise bei 0,1 US-Dollar pro Sekunde und in der öffentlichen Vorschau

Microsoft stellt Sora2, OpenAIs Video-Generierungsmodell, auf Azure AI für die öffentliche Vorschau bereit. Erstmals via Cloud-API für Unternehmen und Entwickler verfügbar, ermöglicht das multimodale Modell die Erstellung neuer Videos aus Text-, Bild- und Videoeingaben und markiert den Eintritt generativer KI-Videotools in die kommerzielle Anwendung.....

Oct 17, 2025

OpenAI Sora 2 neue Funktionen verfügbar Pro-Nutzer generieren Videos bis zu 25 Sekunden lang

Sora2 von OpenAI führt neue Funktionen ein: Web-Version für Profis mit Storyboard-Optionen und verbesserte Flexibilität für alle Nutzer in der App.....

Oct 17, 2025

Google Gemini 3.0 Pro wird in kleinem Umfang bereitgestellt: Stärkung der Schlussfolgerungsfähigkeiten, offizielle Veröffentlichung könnte bis Ende dieses Monats erfolgen

Google DeepMind testet Gemini 3.0 Pro mit ausgewählten Nutzern, Vorabversion als 'intelligentestes Modell' beworben. Offizielle Veröffentlichung für Ende Oktober geplant. Entwickler-A/B-Tests seit Anfang Oktober aktiv.....

Oct 16, 2025

Sora2-Epos-Update! Kostenlose Benutzer können Videos von 15 Sekunden erstellen, Pro-Benutzer können auf 25 Sekunden aufrüsten

Sora2-Update: Kostenlose Nutzer können 15-Sekunden-Videos erstellen, Pro-Nutzer 25 Sekunden mit neuer "Storyboard"-Funktion für präzise Steuerung von Aufnahmen und Effekten.....

Oct 16, 2025

Apple stellt den M5-Chip MacBook Pro vor: Der erste AI-optimierte Mac-Prozessor mit einer Akkulaufzeit von 24 Stunden

Apple präsentiert 14-Zoll MacBook Pro mit M5-Chip, erstmals für AI optimiert. 10-Kern-CPU/GPU mit neuronaler Beschleunigung, 24h Akku, verbesserte Grafikleistung.....

Oct 16, 2025

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Submit Your Model

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

GEO Services

AI Search Visibility Checker

AI Model Compatibility Checker

AI Dataset Collection

Intelligent Document Recognition

SuperCLUE Multimodale Visuelle August-Evaluierungsliste: Gemini-2.5-Pro belegt den ersten Platz

AIbase基地

Dieser Artikel stammt aus dem AIbase-Tagesbericht

Empfohlene verwandte KI-Nachrichten

Tagesbericht über KI: Visual China hat Zusammenarbeit mit mehreren großen Modellunternehmen geschlossen; OpenAI stoppt vorübergehend die Erstellung von verstorbenen Persönlichkeiten durch Sora; Google stellt Werkzeug zur Integration von Kartendaten des Gemini-Modells vor

Google stellt Werkzeug für die Integration von Gemini-Karten-Daten vor: KI kann Echtzeitdaten zu 250 Millionen Orten direkt abrufen

Die mathematischen Leistungen von OpenAI GPT-5 werden angeblich übertrieben, was in der Technologiebranche zu debattieren auslöst

Google Gemini API bietet neue Fähigkeit zur Landmark-Erkennung, AI-Anwendungen werden plötzlich zu lokalen Experten

Tagesbericht über KI: Google Gemini 3.0 Pro wird in kleinem Umfang bereitgestellt; Aishitechnology schließt eine Finanzierungsrunde der Stufe B+ über 100 Millionen Yuan ab; Baidu veröffentlicht ein Modell zur Dokumentenanalyse PaddleOCR-VL

Sora 2 von OpenAI ist nun auf der Microsoft Azure-Plattform verfügbar: Preise bei 0,1 US-Dollar pro Sekunde und in der öffentlichen Vorschau

OpenAI Sora 2 neue Funktionen verfügbar Pro-Nutzer generieren Videos bis zu 25 Sekunden lang

Google Gemini 3.0 Pro wird in kleinem Umfang bereitgestellt: Stärkung der Schlussfolgerungsfähigkeiten, offizielle Veröffentlichung könnte bis Ende dieses Monats erfolgen

Sora2-Epos-Update! Kostenlose Benutzer können Videos von 15 Sekunden erstellen, Pro-Benutzer können auf 25 Sekunden aufrüsten

Apple stellt den M5-Chip MacBook Pro vor: Der erste AI-optimierte Mac-Prozessor mit einer Akkulaufzeit von 24 Stunden

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Submit Your Model

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

GEO Services​

AI Search Visibility Checker

AI Model Compatibility Checker

AI Dataset Collection

Intelligent Document Recognition

SuperCLUE Multimodale Visuelle August-Evaluierungsliste: Gemini-2.5-Pro belegt den ersten Platz

AIbase基地

Dieser Artikel stammt aus dem AIbase-Tagesbericht

Empfohlene verwandte KI-Nachrichten

Tagesbericht über KI: Visual China hat Zusammenarbeit mit mehreren großen Modellunternehmen geschlossen; OpenAI stoppt vorübergehend die Erstellung von verstorbenen Persönlichkeiten durch Sora; Google stellt Werkzeug zur Integration von Kartendaten des Gemini-Modells vor

Google stellt Werkzeug für die Integration von Gemini-Karten-Daten vor: KI kann Echtzeitdaten zu 250 Millionen Orten direkt abrufen

Die mathematischen Leistungen von OpenAI GPT-5 werden angeblich übertrieben, was in der Technologiebranche zu debattieren auslöst

Google Gemini API bietet neue Fähigkeit zur Landmark-Erkennung, AI-Anwendungen werden plötzlich zu lokalen Experten

Tagesbericht über KI: Google Gemini 3.0 Pro wird in kleinem Umfang bereitgestellt; Aishitechnology schließt eine Finanzierungsrunde der Stufe B+ über 100 Millionen Yuan ab; Baidu veröffentlicht ein Modell zur Dokumentenanalyse PaddleOCR-VL

Sora 2 von OpenAI ist nun auf der Microsoft Azure-Plattform verfügbar: Preise bei 0,1 US-Dollar pro Sekunde und in der öffentlichen Vorschau

OpenAI Sora 2 neue Funktionen verfügbar Pro-Nutzer generieren Videos bis zu 25 Sekunden lang

Google Gemini 3.0 Pro wird in kleinem Umfang bereitgestellt: Stärkung der Schlussfolgerungsfähigkeiten, offizielle Veröffentlichung könnte bis Ende dieses Monats erfolgen

Sora2-Epos-Update! Kostenlose Benutzer können Videos von 15 Sekunden erstellen, Pro-Benutzer können auf 25 Sekunden aufrüsten

Apple stellt den M5-Chip MacBook Pro vor: Der erste AI-optimierte Mac-Prozessor mit einer Akkulaufzeit von 24 Stunden

GEO Services