हाल ही में, मेट ने अपने नए AI बड़े मॉडल - LongCat-Flash-Chat को आधिकारिक रूप से जारी किया और ओपन सोर्स कर दिया। इस मॉडल में 560B कुल पैरामीटर और 18.6B से 31.3B के एक्टिवेशन पैरामीटर की सीमा है, जो गणना की दक्षता और प्रदर्शन के बीच एक अद्भुत संतुलन दिखाता है। LongCat-Flash में एक नवाचीन संक्रमण विशेषज्ञ मॉडल (MoE) व्यवस्था का उपयोग किया गया है, जो "शून्य गणना विशेषज्ञ" तकनीक का उपयोग करता है, जिससे प्रत्येक token के संसाधन के दौरान आवश्यक पैरामीटर को सक्रिय किया जाता है, जिससे गणना शक्ति का दक्ष उपयोग सुनिश्चित होता है।

मॉडल व्यवस्था के अंतर्गत, LongCat-Flash में क्रॉस-लेयर चैनल डिज़ाइन का उपयोग किया गया है, जो प्रशिक्षण और अनुमान के समानांतरता को बहुत अधिक बढ़ाता है। इससे मॉडल केवल 30 दिन के प्रशिक्षण के दौरान, H800 हार्डवेयर पर एक उपयोगकर्ता प्रति सेकंड 100 token की अनुमान गति हासिल कर लेता है। ध्यान देने योग्य बात यह है कि इस मॉडल के प्रशिक्षण के दौरान, PID नियंत्रक का उपयोग विशेषज्ञों के विचलन को वास्तविक समय में समायोजित करने के लिए किया गया था, जिससे एक्टिवेशन पैरामीटर का औसत 27B रखा गया था, जिससे गणना शक्ति के उपभोग को दक्षता से नियंत्रित किया गया था।

image.png

इसके अलावा, LongCat-Flash में स्वयं के एजेंट क्षमता में कई सुधार किए गए हैं। अपने ही Agentic मूल्यांकन सेट और बहु-एजेंट डेटा जनरेशन रणनीति के निर्माण के माध्यम से, इस मॉडल ने विभिन्न एजेंट कार्यों में अच्छा प्रदर्शन किया, विशेष रूप से जटिल परिस्थितियों में, इसका VitaBench बेंचमार्क पर स्कोर पहले स्थान पर रहा। बड़े पैमाने पर मॉडल की तुलना में, LongCat-Flash अपने एजेंट उपकरण उपयोग क्षमता में अद्भुत प्रदर्शन करता है।

image.png

सामान्य ज्ञान के मामले में, LongCat-Flash भी पीछे नहीं रहा। ArenaHard-V2 परीक्षण में, इसका स्कोर 86.50 है, जो सभी मूल्यांकन मॉडलों में दूसरा स्थान है; जबकि MMLU और CEval बेंचमार्क परीक्षण में क्रमशः 89.71 और 90.44 के उच्च स्कोर प्राप्त किए गए, जो इसकी भाषा समझ और मूल्यांकन क्षमता में प्रतिस्पर्धा को दर्शाता है।

LongCat-Flash-Chat अपने उच्च गति अनुमान और अद्भुत एजेंट प्रदर्शन के कारण, तकनीकी रूप से अपने प्रतियोगियों से आगे है, और इसके ओपन सोर्स उपाय विकासकर्ताओं के लिए अधिक अनुसंधान और अनुप्रयोग संभावनाएं प्रदान करते हैं।

परियोजना ठेंग: https://github.com/meituan-longcat/LongCat-Flash-Chat

अनुभव वेबसाइट: https://longcat.ai/