Kürzlich hat das Seed-Team von ByteDance auf der AI-Code-Sharing-Plattform Hugging Face das neueste Open-Source-Modell namens Seed-OSS-36B veröffentlicht. Dieses neue Modell konzentriert sich auf fortgeschrittene Schlussfolgerung und Entwicklerfreundlichkeit. Das größte Merkmal dieses Modells ist die Unterstützung von Eingabetexten mit bis zu 512.000 Tokens, was die Produkte von US-Technologieunternehmen wie OpenAI und Anthropic deutlich übertrifft.

Die Seed-OSS-36B-Serie umfasst drei Hauptvarianten: Seed-OSS-36B-Base (mit synthetischen Daten), Seed-OSS-36B-Base (ohne synthetische Daten) und Seed-OSS-36B-Instruct. Die Version mit synthetischen Daten zeigt bessere Ergebnisse in Standard-Benchmark-Tests und eignet sich für allgemeine Anwendungen, während die Version ohne synthetische Daten eine reinere Basis für Forschung bietet. Seed-OSS-36B-Instruct konzentriert sich auf Aufgabenbearbeitung und Befehlsfolge und wurde nachtrainiert, um die Leistung zu optimieren.
Alle Modelle sind unter der Apache-2.0-Lizenz verfügbahr, was bedeutet, dass Forscher und Entwickler diese Modelle kostenlos verwenden, anpassen und weiterverteilen können, ohne Lizenzgebühren an ByteDance zahlen zu müssen. Dies markiert einen weiteren wichtigen Fortschritt chinesischer Unternehmen im Bereich der Open-Source-Modelle und eröffnet gleichzeitig mehr Möglichkeiten für internationale Anwendungen.
Die Design- und Kernmerkmale von Seed-OSS-36B umfassen 3,6 Milliarden Parameter, eine Architektur mit 64 Schichten und ein Vokabular von 155.000 Tokens. Die Fähigkeit des Modells, lange Texte zu verarbeiten und die Einstellungen für den Schlussfolgerungsbudget zu definieren, ermöglicht es Entwicklern, die Schlussfolgerungstiefe des Modells entsprechend der Aufgabentiefe anzupassen. Darüber hinaus zeigte das Modell ausgezeichnete Leistungen in verschiedenen Benchmark-Tests, beispielsweise führende Ergebnisse bei mathematischen und Programmieraufgaben.
Das Seed-Team legt besonderen Wert auf die Zugänglichkeit des Modells. Benutzer können es über Hugging Face Transformers bereitstellen und es unterstützt Quantisierungsformate mit 4 und 8 Bit, um den Speicherbedarf zu reduzieren. Zudem stellt das Team Skripte für die Inferenz, die Anpassung von Prompt und die Integration von Tools bereit, wodurch der Betrieb für kleine Teams vereinfacht wird.
Durch die Bereitstellung von leistungsstarken und flexibel deploybaren Open-Source-Modellen bietet das Seed-Team von ByteDance Unternehmen, Forschern und Entwicklern neue Optionen.
huggingface:https://huggingface.co/collections/ByteDance-Seed/seed-oss-68a609f4201e788db05b5dcd
Wichtige Punkte:
🌟 Das Seed-OSS-36B-Modell unterstützt Eingaben mit bis zu 512.000 Tokens und übertrifft damit die Konkurrenz.
💡 Das Modell ist in Versionen mit und ohne synthetische Daten erhältlich, um unterschiedliche Nutzerbedürfnisse zu erfüllen.
🔧 Alle Modelle können kostenlos verwendet werden und unterstützen verschiedene Deployment- und Integrationsmöglichkeiten, um die Arbeit für Entwickler zu erleichtern.


