Am 30. Juli stellte die Qwen-Team von Alibaba offiziell das neueste Mitglied der Qwen3-Serie – Qwen3-30B-A3B-Instruct-2507 – vor. Dieses neue Open-Source-Modell verwendet den Nicht-Überlegungsmodus (non-thinking mode) und benötigt nur 3B Parameter, um in mehreren Kernleistungen mit bekannten proprietären Modellen wie Gemini2.5-Flash und GPT-4o konkurrieren zu können. Darüber hinaus hat Qwen3-30B-A3B-Instruct-2507 auch erhebliche Fortschritte bei der Mehrsprachigkeit, der Anpassung an Benutzerpräferenzen und der Verarbeitung langer Texte erzielt.
Dieses Modell ist nun vollständig als Open-Source auf der ModelScope-Community und der HuggingFace-Plattform verfügbar. Als neueste Version der Qwen3-30B-A3B-Serie verfügt Qwen3-30B-A3B-Instruct-2507 nicht nur über die Vorteile der Architekturinnovationen des Qwen-Teams, sondern senkt zudem deutlich die Rechenkosten und zielt darauf ab, die Leistungsfähigkeit von Billionen-Parameter-Proprietärmodellen zu erreichen.
Laut offiziellen Daten zeigte Qwen3-30B-A3B-Instruct-2507 bei mehreren Schlüsselbenchmarks wie mathematischer Schlussfolgerung (AIME25-Testergebnis 61,3), Codegenerierung (LiveCodeBenchv6-Ergebnis 43,2), Physik- und Astronomiefragen auf Graduiertenebene (GPQA-Testergebnis 70,4) und Anpassung an menschliche Präferenzen (Arena-Hard v2-Ergebnis 69) beeindruckende Leistungen und übertreffen sogar in einigen Kennzahlen GPT-4o. Dieses Ergebnis markiert eine erhebliche Verbesserung der umfassenden Fähigkeiten dieses Modells in Bereichen wie logisches Denken, Mathematik, Wissenschaft und Programmierung.
Besonders erwähnenswert ist, dass Qwen3-30B-A3B-Instruct-2507 auch bei der Abdeckung seltener Sprachkenntnisse gute Leistungen zeigt und in subjektiven und offenen Aufgaben besser auf die Präferenzen der Benutzer abgestimmt ist, um qualitativ hochwertigere Texte zu generieren und den Nutzern wertvollere Antworten zu liefern. Gleichzeitig wurde seine Fähigkeit zur Verarbeitung langer Texte auf 256K erhöht, was bedeutet, dass Benutzer komplexere Textinhalte verarbeiten können.
Seit der Veröffentlichung im Jahr 2023 wurden über 200 Modelle der Qwen-Serie als Open-Source bereitgestellt, die weltweiten Downloads überschreiten 3 Milliarden Mal, und die Anzahl der abgeleiteten Modelle beträgt über 100.000, was die starke Markteinflussnahme und technologische Potenzial des Teams unterstreicht.