Das Seed-Team von ByteDance hat kürzlich die beeindruckenden Ergebnisse der allgemeinen Hochschulzugangsprüfung (Gaokao) 2025 bekannt gegeben: Der Modell „Dou Bao Seed 1.6-Thinking“ erreichte bei der Gaokao eine Gesamtnote von 683 Punkten im Bereich der Geisteswissenschaften und 648 Punkten im Bereich der Naturwissenschaften, was den Zulassungsgrenzen für Peking- und Tsinghua-Universität entspricht. In Tests von AI-Modellen auf nationaler und internationaler Ebene zeigte es sich als führend.

ByteDance Douyin Dou Bao-Modell

Die Testaufgaben bestanden aus dem neuen Nationalen Fragebogen sowie den selbstgestellten Prüfungen des Bundesstaates Shandong. Dou Bao konkurrierte mit fünf führenden AI-Modellen wie Google Gemini 2.5 Pro, DeepSeek R1 und OpenAI o3. Im Bereich der Geisteswissenschaften erzielte Dou Bao mit 683 Punkten die höchste Note aller Modelle, während es im Bereich der Naturwissenschaften mit 648 Punkten nur knapp hinter dem 655 Punkte umfassenden Google Gemini 2.5 Pro lag. In einzelnen Fächern erzielte Dou Bao die höchsten Noten in sechs Fächern: Chinesisch, Englisch, Physik, Geschichte, Geographie und Politik. Bei Mathematik erreichte es über 140 Punkte und zeigte damit starke logische Schlussfolgerungsfähigkeiten.

In diesem „Kampf um die Gaokao“ zeigten die verschiedenen Modelle unterschiedliche Stärken in bestimmten Fächern. DeepSeek R1 erreichte mit 145 Punkten die höchste Note in Mathematik, Google Gemini 2.5 Pro erzielte mit 82 Punkten die beste Leistung in Chemie, und OpenAI o3 teilte sich mit Google Gemini 2.5 Pro mit 77 Punkten die Bestnote in Biologie. Diese unterschiedlichen Leistungen spiegeln die spezifischen Merkmale der Wissensstruktur und der Denkweise verschiedener AI-Modelle wider.

QQ20250626-095943.png

Das Seed-Team entdeckte einen wichtigen technischen Aspekt: Während des ersten Tests litt das Netzwerkexemplar an geringer Bildqualität, wodurch viele Modelle in Fächern, die auf Bildern basieren, wie Chemie und Biologie stark abstrichen. Nachdem das Team hochauflösende Bilder der Prüfungsfragen erhielt, führte es eine erneute Prüfung mit einem Mischverfahren aus Text und Bild durch. Das Ergebnis zeigte, dass Dou Bao in Chemie und Biologie um fast 30 Punkte besser abschnitt und insgesamt 676 Punkte im Bereich der Naturwissenschaften erreichte. Dieses Ergebnis bestätigte die Bedeutung der multimodalen Inferenz zur Aktivierung des Potenzials von Modellen und lieferte wichtige Erkenntnisse für die Entwicklung von visueller Verständnisfähigkeit und multimodaler Inferenz in der KI.

Shandong verwendet ein „3+3“-Prüfungssystem. Die Grundfächer sind Chinesisch, Mathematik und Englisch, während drei weitere Fächer nach einem Bewertungssystem basierend auf Noten bewertet werden. Laut Analyse eines erfahrenen Lehrers aus Shandong könnte die Gesamtnote von Dou Bao bis zu etwa 690 Punkten betragen. Wenn man den Tabellen für die Punkteverteilung aus dem Jahr 2025 in Shandong vergleicht, würde dies eine Platzierung unter den Top 80 bedeuten und ausreichen, um sich um renommierte Universitäten wie Peking- und Tsinghua-Universität zu bewerben. Diese Leistung zeigt nicht nur die absolute Stärke von Dou Bao, sondern auch ihre Fähigkeit, sich in komplexen Bewertungssystemen zurechtzufinden.