हाल ही में, एनविडिया ने एक नया छोटा भाषा मॉडल, नेमोट्रॉन-नैनो-9बी-वी2 लॉन्च किया है, जो विभिन्न बेंचमार्क परीक्षणों में अच्छा प्रदर्शन करता है और उपयोगकर्ता इसके तर्क कार्य के चालू/बंद करने में लचीलापन से नियंत्रण कर सकते हैं। नेमोट्रॉन-नैनो-9बी-वी2 के 9 बिलियन पैरामीटर हैं, जो इसके पूर्ववर्ती के 12 बिलियन पैरामीटर की तुलना में बहुत कम हैं, जिसका उद्देश्य एक एनविडिया A10 GPU पर डेप्लॉयमेंट के लिए अनुकूलित करना है।

image.png

एनविडिया के AI मॉडल के बाद के ट्रेनिंग डायरेक्टर ओलेक्सी कुचिएव ने कहा कि यह मॉडल विशेष रूप से A10GPU के लिए अनुकूलित किया गया है, जो उच्च गति तक पहुंच सकता है, जो विभिन्न अनुप्रयोगों के लिए उपयुक्त है। नेमोट्रॉन-नैनो-9बी-वी2 अंग्रेजी, जर्मन, स्पैनिश, फ्रेंच, इटालियन, जापानी, साथ ही विस्तृत कोरियाई, पुर्तगाली, रूसी और चीनी जैसी विभिन्न भाषाओं का समर्थन करता है, जो निर्देश अनुसरण और कोड जनरेशन कार्यों के लिए उपयोगी है।

इस मॉडल को नेमोट्रॉन-एच श्रृंखला पर आधारित है, जो मैम्बा और ट्रांसफॉर्मर संरचना के संयोजन के साथ आता है, जो लंबे अनुक्रम के प्रबंधन में स्मृति और गणना की आवश्यकता कम कर सकता है। पारंपरिक ट्रांसफॉर्मर मॉडल के विपरीत, नेमोट्रॉन-एच मॉडल चयनात्मक स्टेट स्पेस मॉडल (SSM) का उपयोग करता है, जो सटीकता सुनिश्चित करते हुए लंबे सूचना अनुक्रमों के अधिक कुशल निपटान की अनुमति देता है।

image.png

अनुमान कार्य में, नेमोट्रॉन-नैनो-9बी-वी2 अपने अनुमान प्रक्रिया के ट्रैकिंग रिकॉर्ड को डिफ़ॉल्ट रूप से उत्पन्न कर सकता है, उपयोगकर्ता सरल नियंत्रण निर्देशों के माध्यम से, जैसे /think या /no_think, इस कार्य को स्विच कर सकते हैं। इसके अलावा, मॉडल ने "सोच बजट" प्रबंधन शुरू किया है, जो विकासकर्ताओं को अनुमान के लिए उपयोग किए जाने वाले अधिकतम टोकन संख्या के निर्धारण की अनुमति देता है, जिससे सटीकता और प्रतिक्रिया गति के बीच संतुलन बनाए रखा जा सकता है।

बेंचमार्क परीक्षण में, नेमोट्रॉन-नैनो-9बी-वी2 अच्छी सटीकता दिखाता है। उदाहरण के लिए, NeMo-Skills सेट के "अनुमान चालू" मोड में, यह मॉडल कई परीक्षणों में अच्छा प्रदर्शन करता है, जो अन्य छोटे ओपन सोर्स मॉडलों की तुलना में लाभ दिखाता है।

एनविडिया ने नेमोट्रॉन-नैनो-9बी-वी2 को खुले मॉडल लाइसेंस के साथ जारी किया है, जो व्यावसायिक उपयोग के लिए अनुमति देता है और विकासकर्ताओं को विकल्प मॉडल बनाने और फैलाने की आजादी देता है। ध्यान देने योग्य बात यह है कि एनविडिया मॉडल द्वारा उत्पादित आउटपुट के लिए मुक्त नहीं होता है, उपयोगकर्ता अपने उपयोग के पूर्ण नियंत्रण में रहते हैं।

इस मॉडल के जारी करने का उद्देश्य विकासकर्ताओं को छोटे वातावरण में अनुमान क्षमता और डेप्लॉयमेंट की दक्षता के बीच संतुलन के लिए उपकरण प्रदान करना है, जो एनविडिया के भाषा मॉडल की दक्षता और नियंत्रित अनुमान क्षमता में सुधार के लिए लगातार प्रयास को चिह्नित करता है।

huggingface:https://huggingface.co/nvidia/NVIDIA-Nemotron-Nano-9B-v2

मुख्य बिंदु:

🌟 एनविडिया ने नए छोटे भाषा मॉडल, नेमोट्रॉन-नैनो-9बी-वी2 का अनुमान कार्य के लिए उपयोगकर्ता लचीलापन से नियंत्रण कर सकते हैं।  

⚙️ इस मॉडल के आधुनिक मिश्रित संरचना के आधार पर लंबे अनुक्रम की जानकारी के अधिक कुशल निपटान की अनुमति है, जो विभिन्न भाषा कार्यों के लिए उपयोगी है।  

📊 नेमोट्रॉन-नैनो-9बी-वी2 खुले मॉडल लाइसेंस के साथ जारी किया गया है, जो विकासकर्ताओं के व्यावसायिक उपयोग और विकल्प मॉडल बनाने की अनुमति देता है।