- <p>ह récent में, MiniMax कंपनी ने अपने नया मॉडल MiniMax-M1 को जारी किया है, जो विश्व का पहला open-source बड़ा मिश्रित आर्किटेक्चर निष्कर्षण मॉडल है। इस मॉडल ने उच्च उत्पादकता जुड़ी जटिल स्थितियों में उत्कृष्ट प्रदर्शन दिखाया और open-source मॉडलों में एक वर्जन प्रमुख बनाया है। MiniMax-M1 न केवल देश के closed-source मॉडलों से ऊपर है, बल्कि विदेशी सबसे आगे रहने वाले मॉडलों के स्तर तक पहुंच गया है, जबकि उद्योग में सबसे अधिक प्रभावित प्रतिभागिता बनाए रखता है।</p>
- <p>MiniMax-M1 का एक महत्वपूर्ण विशेषता 10 लाख तक भारी परिसर इनपुट समर्थित करना है, जो Google Gemini2.5Pro के समान है और DeepSeek R1 के 8 गुना अधिक है, और अधिकतम 80,000 Token निष्कर्षण परिणाम छोड़ सकता है। इस उपलब्धता का उद्घाटन MiniMax की अद्वितीय विशेषता है, जो लाइट्निंग ध्यानाकर्षण मैकेनिज्म पर आधारित मिश्रित आर्किटेक्चर है, जिससे लंबे परिसर इनपुट और गहरे निष्कर्षण प्रसंस्करण में काफी उपयोग में लाने पर अद्वितीय प्रभाव प्रदर्शित करता है। उदाहरण के तौर पर, 80,000 Token के निष्कर्षण के लिए, MiniMax-M1 को DeepSeek R1 की तुलना में केवल 30% कंप्यूटेशन पावर की आवश्यकता होती है, जिससे ट्रेनिंग और निष्कर्षण के दौरान कंप्यूटेशन प्रभाव भी बढ़ता है।</p>
- <p style="text-align:center"><img src="https://upload.chinaz.com/2025/0617/6388574815298339858288562.png" title="वेस्ट छोटी_20250617090813.png" alt="वेस्ट छोटी_20250617090813.png"/></p>
- <p>इसके अलावा, MiniMax ने CISPO नामक तेज़ बढ़ावा प्राप्त करने वाला एल्गोरिदम पेश किया है, जो महत्वपूर्णता नमूना भार को कटाने पर विशेषज्ञता के प्रभाव को बढ़ाता है। AIME परीक्षणों में, CISPO एल्गोरिदम की अभिसरण प्रदर्शनीयता byte के हाल ही में प्रस्तुत किए गए DAPO सहित अन्य बढ़ावा प्राप्त करने वाले एल्गोरिदमों की तुलना में दोगुनी तेजी रही है, जो DeepSeek के प्रारंभिक GRPO एल्गोरिदम से भी बेहतर था। ये नवाचारी तकनीक MiniMax-M1 के बढ़ावा प्राप्त करने के प्रक्रिया में अत्यधिक कुशल हैं, और इसकी प्रशिक्षण की प्रक्रिया में 512 H800 की संख्या के साथ तीन सप्ताह के लिए बंटवारा किया गया था, जिससे किराए की लागत कम हुई और अपेक्षित मात्रा से एक दशक कम हो गई।</p>
- <p>आर्टिकल में बताया गया है कि MiniMax-M1 उद्योग के प्रमुख 17 परीक्षण सेटों पर सर्वश्रेष्ठ प्रदर्शन प्रदर्शित करता है। विशेष रूप से सॉफ्टवेयर इंजीनियरिंग, लंबे परिसर और उपकरण उपयोग जैसी उच्च उत्पादकता संबंधी जटिल स्थितियों में, MiniMax-M1 की प्रदर्शन की शक्ति उत्कृष्ट है। उदाहरण के लिए, SWE-bench परीक्षण बेंचमार्क पर, MiniMax-M1-40k और MiniMax-M1-80k क्रमशः 55.6% और 56.0% के प्रदर्शन के साथ परिणाम दिखाए गए हैं, जो DeepSeek-R1-0528 के 57.6% से थोड़ा कम है, लेकिन अन्य open-source weight models की तुलना में मुश्किल से ही अधिक उत्कृष्ट है। इसके अलावा, इसके लाखों Token परिसर विंडो के बल पर, MiniMax-M1 लंबे परिसर समझ के परीक्षण में सर्वश्रेष्ठ प्रदर्शन प्रदर्शित करता है, और सभी open-source weight models से ऊपर है, बहुत से पहलुओं में OpenAI o3 और Claude4Opus के समान है, जो विश्व में दूसरा स्थान पर है।</p>
- <p>इसके अलावा, MiniMax-M1 TAU-bench (टूल उपयोग परीक्षण) में भी सभी open-source weight models से आगे है और Gemini-2.5Pro को पराजित करता है। इसके अलावा, MiniMax-M1-80k मुख्य बेंचमार्क परीक्षणों में अधिकतम MiniMax-M1-40k से बेहतर प्रदर्शन प्रदर्शित करता है, जो गणना संसाधनों की विस्तृत टेस्टिंग के प्रभाव को पूरी तरह से प्रमाणित करता है।</p>
- <p>मूल्य रुपरेखा में, MiniMax-M1 उद्योग में सबसे कम मूल्य का प्रदर्शन करता है। MiniMax APP और Web पर, इस मॉडल का अनंत प्रयोग करने के लिए उपयोगकर्ता को मुफ़्त प्रदान किया जाता है, और ऑफ़्फ़ीसल वेबसाइट पर API सेवा अत्यधिक प्रतिस्पर्धा प्रतिस्पर्धा दर के साथ खरीदी जा सकती है। यह निर्णय निश्चित रूप से MiniMax-M1 के बाजार में व्यापकता और उपयोग को बढ़ाएगा।</p>
MiniMax-M1 स्रोत कोड: विश्व का पहला बड़े पैमाने पर मिश्रित आर्किटेक्चर अनुमानित मॉडल

AIbase基地
19.0k
यह लेख AIbase दैनिक से है
【AI दैनिक】 कॉलम में आपका स्वागत है! यहाँ आर्टिफ़िशियल इंटेलिजेंस की दुनिया का पता लगाने के लिए आपकी दैनिक मार्गदर्शिका है। हर दिन हम आपके लिए AI क्षेत्र की हॉट कंटेंट पेश करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, तकनीकी रुझानों को समझने में आपकी मदद करते हैं और अभिनव AI उत्पाद अनुप्रयोगों को समझते हैं।
—— AIbase दैनिक समूह द्वारा बनाया गया
© सर्वाधिकार सुरक्षित AIbase बेस 2024, स्रोत देखने के लिए क्लिक करें -