Die SiliconCloud hat das weltweit erste Open-Source-Modell für große Mischungsanwendungen von Aufmerksamkeitsmechanismen – MiniMax-M1-80k (456B) – offiziell veröffentlicht. Dieses innovative Modell soll komplexe Aufgaben wie Software-Engineering, lange Kontextverstehen und Werkzeugnutzung stark unterstützen und zeigt bei der Leistung mit Spitzenmodellen wie o3 und Claude4Opus durchaus vergleichbare Ergebnisse.
Nach Angaben wurde MiniMax-M1-80k mit einem maximalen Kontextumfang von 128K entwickelt, was es Benutzern enorm erleichtert, lange Texte zu bearbeiten. Für spezielle Anforderungen bieten wir auch eine Backendunterstützung für bis zu 1M Kontextlänge an. Der Preis beträgt pro Million Tokens 4¥ für die Eingabe und 16¥ für die Ausgabe. Neue Nutzer erhalten bei ihrer ersten Nutzung einen Gutschein im Wert von 14¥.
Das Modell MiniMax-M1-80k basiert auf MiniMax-Text-01 und verwendet eine hybride Expertensystemarchitektur (MoE) sowie ein Lightning-Attention-Mechanismus mit einer effizienten Rahmenarbeit für verstärkte Lernen. Diese Architektur ermöglicht es dem Modell nicht nur traditionelle mathematische Schlussfolgerungsaufgaben zu lösen, sondern auch in echten Sandbox-Software-Entwicklungsumgebungen einzusetzen. Daher ist es die ideale Wahl für komplexe Aufgaben mit langen Texten und tiefer Denkschritte.
In Bezug auf die Leistung zeigt MiniMax in Benchmarks, dass bei der Generierung von 100.000 Tokens die FLOPs-Belastung lediglich 25% von DeepSeek R1 beträgt, was die effiziente Erweiterbarkeit der Inferenzleistung zeigt. Außerdem zeigen die Testergebnisse in den Bereichen Mathematik, Programmierung, Werkzeugnutzung und langer Kontextverständnis keine Unterschiede zu Spitzenmodellen wie o3.
Als One-Stop-Großmodul-Cloud-Dienstplattform bietet SiliconCloud Entwicklern qualitativ hochwertige Dienste. Neben MiniMax-M1-80k bietet die Plattform noch weitere hervorragende Modelle wie DeepSeek-R1-0528, Qwen3 und GLM-4-Serie an, wodurch Entwicklern viele Optionen zur Verfügung stehen. Insbesondere sind Versionen des Free-to-Use-DeepSeek-R1 und andere Modelle kostenlos nutzbar, um Entwicklern "Token-Freiheit" zu ermöglichen.
Um MiniMax-M1-80k auszuprobieren, können Nutzer die SiliconCloud-Website besuchen, um Online-Erlebnis und Integration zu nutzen und so die Entwicklung generativer KI weiter voranzutreiben.
Online-Erlebnis
https://cloud.siliconflow.cn/models
Tutorial zur Drittanbieter-Anwendung
https://docs.siliconflow.cn/cn/usercases/