चांद के अंधेरे वाली कंपनी ने अपना नया शिखर - Kimi K2 मॉडल आधिकारिक रूप से जारी किया और समान समय पर ओपन सोर्स की घोषणा की। यह MoE आर्किटेक्चर पर आधारित बेस मॉडल, अपनी मजबूत कोड क्षमता, उत्कृष्ट सामान्य Agent कार्य प्रबंधन क्षमता के कारण, जारी होते ही AI क्षेत्र में व्यापक ध्यान आकर्षित कर गया।
Kimi K2 मॉडल के कुल 1 ट्रिलियन पैरामीटर हैं, जबकि सक्रिय पैरामीटर 32 बिलियन हैं। SWE Bench Verified, Tau2, AceBench आदि एक श्रृंखला में बेंचमार्क प्रदर्शन परीक्षणों में, इसने ओपन सोर्स मॉडल में शीर्ष प्रदर्शन प्राप्त किया, जो कोड लेखन, Agent कार्य के कार्यान्वयन और गणितीय तर्क में इसकी अग्रणी क्षमता को दर्शाता है।
पूर्व-प्रशिक्षण चरण में, Kimi K2 ने नवाचार के म्यूनक्लिप ऑप्टिमाइज़र का उपयोग किया, जो बड़े पैमाने पर प्रशिक्षण में attention logits के बड़े होने की समस्या को समाधान करने में प्रभावी रहा, जिससे प्रशिक्षण स्थिरता और token उपयोग दक्षता को नए स्तर तक ले गया। चांद के अंधेरे टीम ने 15.5T token के स्थिर प्रशिक्षण को सफलतापूर्वक पूरा किया, जिसमें कभी भी loss spike नहीं देखा गया, जिससे ट्रिलियन पैरामीटर मॉडल के स्थिर और कुशल प्रशिक्षण के लिए एक नई अवधारणा प्रस्तुत की गई।
अनुकूलन प्रदर्शन परीक्षणों में अच्छे प्रदर्शन के अलावा, Kimi K2 वास्तविक अनुप्रयोग स्थितियों में भी क्षमता व्यापकता और उपयोगिता के साथ उभरा। कोड क्षमता में, Kimi K2 डिज़ाइन और दृश्य प्रस्तुति के साथ आगे के कोड उत्पन्न कर सकता है, कण प्रणाली, दृश्यता और 3D स्थिति आदि के जटिल प्रदर्शन का समर्थन कर सकता है, और विशिष्ट निर्देशों के बिना, पूर्ण विपणन लेनदेन अंतर्मुखी बना सकता है, जो इसकी मजबूत स्वयं-प्रोग्रामिंग क्षमता को दर्शाता है।
Agent उपकरण बुलाओ में, Kimi K2 भी उत्कृष्ट प्रदर्शन करता है। यह जटिल निर्देशों को स्थिर रूप से समझ सकता है, आवश्यकताओं को एक श्रृंखला में स्पष्ट रूप से निर्दिष्ट करके ToolCall संरचना में विभाजित कर सकता है, जो कि सीधे कार्यान्वित करने योग्य होती है, जो विभिन्न Agent/Coding फ्रेमवर्क में बिना किसी अंतर के एकीकृत हो सकती है, जटिल कार्य या स्वचालित कोडिंग पूरा करती है। दूरस्थ कार्य के अनुपात के वेतन पर प्रभाव का विश्लेषण करना, या Coldplay फैंस के लिए एक अनुसरण योजना बनाना और संबंधित योजना पूरा करना, Kimi K2 के लिए आसान है, जो इसकी मजबूत Agent क्षमता को दर्शाता है।
इसके अलावा, Kimi K2 में शैलीगत लेखन में भी नोट करने योग्य सुधार हुआ है। वैज्ञानिक पाठ को माध्यमिक छात्रों के भाषा शैली में पुनर्लेखित करना, या Apple विज्ञापन लेखन की शैली की नकल करना, Kimi K2 द्वारा उत्पादन शैली को सटीक रूप से नियंत्रित किया जा सकता है, साथ ही मूल अर्थ और व्यक्ति के शैली को बरकरार रखा जाता है। आभासी लेखन कार्य में, Kimi K2 द्वारा उत्पन्न लेखन विवरण और भावना पर अधिक ध्यान देता है, जो अब अमूर्त और आम बातों में नहीं होता है, जो उपयोगकर्ता के लिए अधिक समृद्ध रचनात्मक अनुभव प्रदान करता है।
चांद के अंधेरे कंपनी ने Kimi K2 मॉडल के अलावा, Kimi-K2-Base और Kimi-K2-Instruct दो मॉडल संस्करण भी ओपन सोर्स किया। जिसमें, Kimi-K2-Base अनुदेश अनुकूलन के बिना बेस पूर्व-प्रशिक्षित मॉडल है, जो वैज्ञानिक अनुसंधान और स्वयं-निर्मित परिस्थितियों के लिए उपयुक्त है; जबकि Kimi-K2-Instruct सामान्य अनुदेश अनुकूलन संस्करण है, जो अधिकांश प्रश्न-उत्तर और Agent कार्य में उत्कृष्ट प्रदर्शन करता है। मॉडल और fp8 भार फाइलें HuggingFace प्लेटफॉर्म पर ओपन सोर्स की गई हैं, जिससे विकासकर्ताओं के लिए मुफ्त उपयोग के लिए उपलब्ध हैं।
विकासकर्ताओं के लिए डेप्लॉयमेंट और उपयोग के लिए सुविधा के लिए, vLLM, SGLang, ktransformers आदि अनुकूलन इंजन भी Kimi K2 मॉडल के समर्थन में आ गए हैं। विकासकर्ता अपने सर्वर पर डेप्लॉय कर सकते हैं और Kimi ओपन प्लेटफॉर्म API के समान अनुभव प्राप्त कर सकते हैं।
API सेवा के मामले में, Kimi K2 ने पूर्ण समर्थन प्रदान किया है। इसकी API सेवा अब पूरी तरह से लॉन्च की गई है, जो लंबे 128K संदर्भ तक समर्थन करती है, जो सामान्यता और उपकरण कॉल क्षमता में अधिक शक्तिशाली है। भुगतान योजना लचीली और व्यवहार्य है, प्रति मिलियन प्रविष्टि tokens केवल 4 रुपये हैं, प्रति मिलियन निर्गम tokens 16 रुपये हैं, और OpenAI और Anthropic दोनों API प्रारूप के साथ संगत है, जिससे विकासकर्ता बिना किसी अंतर के सीधे स्थानांतरित कर सकते हैं।