Im Internet kursieren kürzlich wichtige Informationen über die bevorstehende Veröffentlichung einer Open-Source-Modellreihe von OpenAI namens „GPT-OSS“ (GPT Open Source Software), was großes Interesse in der Branche auslöste. Laut den geheimen Konfigurationsdateien hat diese Modellreihe Parametergrößen zwischen 2 Milliarden und 12 Milliarden, verwendet eine fortschrittliche MoE-(Mixture of Experts)-Architektur und kombiniert erweiterte langfristige Kontexte mit effizienten Aufmerksamkeitsmechanismen, was ein starkes Leistungspotenzial zeigt. Das Redaktionsteam von AIbase analysiert für Sie tiefgehend die technischen Highlights von GPT-OSS und deren potenziellen Einfluss auf die AI-Branche.

MoE-Architektur-Revolution: Eine leistungsstarke Engine mit 11,6 Milliarden seltener Parametern. Die GPT-OSS-Modellreihe verwendet eine Mixture of Experts (MoE)-Transformer-Architektur mit 36 Schichten, 128 Experten und einem Top-4-Routing-Mechanismus. Insgesamt betragen die selteneren Parameter 11,6 Milliarden, während aktive Parameter etwa 510 Millionen betragen. Diese Architektur verteilt Berechnungsaufgaben auf verschiedene Expertenmodule, wodurch der Ressourcenverbrauch deutlich reduziert wird, gleichzeitig jedoch die Leistung des Modells gewahrt bleibt. Im Vergleich zu traditionellen dichteren Modellen ermöglicht die MoE-Architektur, dass GPT-OSS auf einer breiteren Palette von Hardwareumgebungen läuft und Entwicklern und der Open-Source-Community mehr Flexibilität bietet.

image.png

Massive Parametergröße: Insgesamt 11,6 Milliarden seltene Parameter, wobei nur 510 Millionen aktive Parameter vorhanden sind, um ein Gleichgewicht zwischen effizienter Berechnung und starker Leistung sicherzustellen.

Flexibles Deployment: Die MoE-Architektur reduziert die Abhängigkeit von Hochleistungs-GPU-Clustern, sodass auch kleine und mittlere Teams dieses Modell für ihre Entwicklung nutzen können.

Erweiterung langer Kontexte: Fähigkeit von 131.000 Tokens. GPT-OSS hat eine bedeutende Fortschritts in der Kontextverarbeitung erzielt. Die ursprüngliche Kontextlänge beträgt 4096 Tokens und wird durch Technologie wie RoPE (Rotary Position Embedding) auf etwa 131.000 Tokens erweitert. Diese Fähigkeit für lange Kontexte ermöglicht es dem Modell, extrem lange Dokumente und komplexe Dialogszenarien zu verarbeiten, was sich für akademische Forschung, Rechtsanalyse und große Codegenerierung eignet.

Zudem verwendet das Modell einen Schlittenfenster- Aufmerksamkeitsmechanismus (Sliding Window Attention), wobei die Fenstergröße 128 Tokens beträgt und in Kombination mit GQA (Grouped Query Attention) Technologien pro Token und Schicht nur etwa 72 KB KV-Cache beansprucht. Diese Gestaltung verringert signifikant den Speicherbedarf und bewahrt gleichzeitig eine effiziente parallele Verarbeitungsfähigkeit, was eine hervorragende Leistung für die Verarbeitung langer Dokumente gewährleistet. Optimierung der Aufmerksamkeitsmechanismen: 64 Kopien von GQA und hohe Durchsatzleistung. Die Aufmerksamkeitsmechanismen von GPT-OSS sind ebenfalls beachtenswert.

Das Modell verfügt über 64 Aufmerksamkeitsköpfe, wobei jeder Kopf eine Dimension von 64 besitzt, und kombiniert die GQA-Technik, um die Berechnungseffizienz weiter zu optimieren. Im Vergleich zu traditionellen Multi-Head-Aufmerksamkeiten reduziert GQA die Berechnungskomplexität durch gruppierte Abfragen und erhöht gleichzeitig die Modellkapazität durch breitere Aufmerksamkeitsprojektionen (breiter als die versteckte Dimension). Dieses Design ist besonders geeignet für Szenarien mit hoher Durchsatzleistung und niedriger Latenz, wie beispielsweise Echtzeitübersetzung, Code-Vervollständigung und Generierung langer Dokumente.

Vorteile der Leistung: Kombination von GQA und Schlittenfenster: Erhebliche Reduzierung des Speicherbedarfs für KV-Cache und Verbesserung der Dekodierleistung.

NTK RoPE-Unterstützung: Durch die nicht gleichmäßige zeitabhängige Erweiterung von RoPE wird die Stabilität der Positionscode-Erweiterung im Szenario langer Kontexte gewährleistet.

Hohe Durchsatzoptimierung: Das Modell verfügt über ausgezeichnete KV-Kosten und parallele Eigenschaften bei der Dekodierung, was es für Umgebungen mit großer Skalierung geeignet macht.

Die strategische Wende des Open-Source-Ansatzes: Ist OpenAI zurück zu seinem ursprünglichen Ideal der Offenheit? Die Gerüchte über die Open-Source-Veröffentlichung von GPT-OSS gelten als bedeutender strategischer Wechsel. Als Unternehmen, das in den letzten Jahren immer mehr Modelle geschlossen hat, könnte dieser Schritt auf die langfristigen Erwartungen der Open-Source-Community reagieren und gleichzeitig den starken Auftritt von Wettbewerbern wie Meta und Mistral im Bereich Open-Source-AI kontern. Laut den entwichenen Informationen umfasst die GPT-OSS-Reihe verschiedene Versionen (wie Modelle mit 2 Milliarden und 12 Milliarden Parametern), was darauf hindeutet, dass OpenAI beabsichtigt, ein Modellportfolio zu schaffen, das unterschiedliche Anforderungen abdeckt und Entwicklern mehr Auswahlmöglichkeiten bietet.

Doch die entwichenen Konfigurationsdateien lösten auch Kontroversen aus. Einige Entwickler bemerkten, dass der MoE-Modell mit 11,6 Milliarden Parametern zwar theoretisch stark sei, aber die praktische Ausführung möglicherweise eine leistungsstarke Hardware erfordere. Zum Beispiel benötigte das Modell mit 12 Milliarden Parametern bis zu 1,5 TB RAM, was für normale Entwickler immer noch eine große Herausforderung darstelle. OpenAI hat die Authentizität dieser Informationen noch nicht offiziell bestätigt, doch die Branche glaubt allgemein, dass die Veröffentlichung von GPT-OSS einen tiefgreifenden Einfluss auf die AI-Ökologie haben wird.

Auffassung von AIbase:

Der potenzielle Einfluss und die Herausforderungen von GPT-OSS. Die entwichenen Informationen über GPT-OSS zeigen, dass OpenAI neue Versuche im Bereich Open-Source unternimmt. Seine MoE-Architektur, die Erweiterung langer Kontexte und die effizienten Aufmerksamkeitsmechanismen demonstrieren die technischen Trends der nächsten Generation von AI-Modellen. Durch die Reduzierung der Berechnungsschwelle und die Optimierung des Speicherverbrauchs wird GPT-OSS Chancen für kleine und mittlere Entwickler sowie Forschungsinstitute bieten. Doch die hohe Hardwareanforderung des Modells und die noch nicht vollständig offenen Trainingsdetails könnten seine Verbreitung behindern. Zukünftig wird es interessant sein zu beobachten, wie OpenAI seinen Open-Source- und kommerziellen Strategieabwägungen gerecht wird und wie es die tatsächliche Implementierung des Modells optimiert.

Schlusswort

Die entwichenen Informationen über OpenAI GPT-OSS enthüllen das Geheimnis der nächsten Generation von AI-Modellen. Seine leistungsstarke MoE-Architektur und die Fähigkeit zur Verarbeitung langer Kontexte deuten auf eine neue Ära der AI-Technologie hin. AIbase wird weiterhin diesen Vorfall verfolgen und Sie mit den neuesten Technologie-Nachrichten versorgen. Bitte erwarten Sie die offizielle Veröffentlichung von GPT-OSS und wie sie der Open-Source-AI-Ökologie neuen Schwung verleihen wird!