Kürzlich hat die Shanghai-Unternehmen für KI-Schnellwachstum MiniMax offiziell den weltweit ersten Open-Source-Modell mit einer großen gemischten Architektur zur Inferenz namens MiniMax-M1 vorgestellt. Sobald das Modell auf den Markt kam, erreichte es schnell eine führende Position in autorisierten Bewertungstabellen und wurde weltweit zweitplatziert unter den Open-Source-Modellen, nur hinter dem kürzlich veröffentlichten DeepSeek-R1-0528. Dieses Meilenstein-Ergebnis ließ den Gründer und CEO von MiniMax, Yan Junjie, auf sozialen Medien kommentieren: „Erstmals habe ich das Gefühl, dass ein Berg überwunden werden kann.“
Die Vorstellung von MiniMax-M1 ist nicht nur auffällig, sondern auch in technischen Details beeindruckend. Das Modell zeigt starke Vorteile bei der Verarbeitung langer Texte und der Aufruf von Tools. Es unterstützt bis zu 1 Million Token als Kontext-Eingabe und ist in der Lage, den gesamten englischen Originaltext von "Drei Körpern" auf einmal zu verarbeiten. Diese Leistung beträgt achtmal so viel wie die gleichen Modelle von DeepSeek und kann sogar mit dem neuesten geschlossenen Modell von Google, Gemini2.5Pro, mithalten.
Was noch beeindruckender ist, ist, dass MiniMax in der Phase der Verstärkungslernentwicklung nur 535.000 US-Dollar investiert hat, weit unter dem üblichen Entwicklungsosten im Millionenbereich der Branche, was seine hervorragende Entwicklungs-effizienz und Produktionsfähigkeit zeigt. Innerhalb von vier Arbeitstagen nach der Veröffentlichung von M1 stellte MiniMax mehrere innovative Produkte vor, darunter das Video-Generationsmodell Hailuo02, das allgemeine intelligente System MiniMax Agent, das Video-Kreativ-Intelligent-System Hailuo Video Agent und das Stimmen-Design-Tool Voice Design, wobei es einen bemerkenswerten „Tagesaktualisierungs“-Rhythmus beibehält.
Als eine KI-Firma, die in Xuhui, Shanghai, ansässig ist, begann MiniMax bereits vor Ende 2022, als ChatGPT den globalen Hype auslöste, mit der Entwicklung des Bereichs Allgemeiner KI (AGI) und entschloss sich, die damals beliebten dichten Architekturen großer Modelle und traditionellen Aufmerksamkeitsmechanismen abzulehnen. Während viele Unternehmen in der globalen KI-Modellentwicklung ihre Aktivitäten reduzierten, beharrte MiniMax entschlossen auf der strategischen Wahl der Grundmodellentwicklung und erreichte schließlich diese technologische Durchbruch.
Man kann sagen, dass die Veröffentlichung von MiniMax-M1 nicht nur ein großer Schritt auf technischer Ebene war, sondern auch eine wichtige Impulsgebung für die Zukunft der Branche, möglicherweise eine Neubewertung der Entwicklungsrichtung von Open-Source-KI-Modellen auslöst.