एनविडिया नए प्रकार के छोटे खुले मॉडल नेमोट्रॉन-नैनो-9बी-वी2 लॉन्च करता है जो स्मार्ट रिज़निंग स्विच का समर्थन करता है

AIbase基地

द्वारा प्रकाशितAI समाचार · 6 मिनट पढ़ें · Aug 19, 2025

हाल ही में, एनविडिया ने एक नया छोटा भाषा मॉडल, नेमोट्रॉन-नैनो-9बी-वी2 लॉन्च किया है, जो विभिन्न बेंचमार्क परीक्षणों में अच्छा प्रदर्शन करता है और उपयोगकर्ता इसके तर्क कार्य के चालू/बंद करने में लचीलापन से नियंत्रण कर सकते हैं। नेमोट्रॉन-नैनो-9बी-वी2 के 9 बिलियन पैरामीटर हैं, जो इसके पूर्ववर्ती के 12 बिलियन पैरामीटर की तुलना में बहुत कम हैं, जिसका उद्देश्य एक एनविडिया A10 GPU पर डेप्लॉयमेंट के लिए अनुकूलित करना है।

एनविडिया के AI मॉडल के बाद के ट्रेनिंग डायरेक्टर ओलेक्सी कुचिएव ने कहा कि यह मॉडल विशेष रूप से A10GPU के लिए अनुकूलित किया गया है, जो उच्च गति तक पहुंच सकता है, जो विभिन्न अनुप्रयोगों के लिए उपयुक्त है। नेमोट्रॉन-नैनो-9बी-वी2 अंग्रेजी, जर्मन, स्पैनिश, फ्रेंच, इटालियन, जापानी, साथ ही विस्तृत कोरियाई, पुर्तगाली, रूसी और चीनी जैसी विभिन्न भाषाओं का समर्थन करता है, जो निर्देश अनुसरण और कोड जनरेशन कार्यों के लिए उपयोगी है।

इस मॉडल को नेमोट्रॉन-एच श्रृंखला पर आधारित है, जो मैम्बा और ट्रांसफॉर्मर संरचना के संयोजन के साथ आता है, जो लंबे अनुक्रम के प्रबंधन में स्मृति और गणना की आवश्यकता कम कर सकता है। पारंपरिक ट्रांसफॉर्मर मॉडल के विपरीत, नेमोट्रॉन-एच मॉडल चयनात्मक स्टेट स्पेस मॉडल (SSM) का उपयोग करता है, जो सटीकता सुनिश्चित करते हुए लंबे सूचना अनुक्रमों के अधिक कुशल निपटान की अनुमति देता है।

अनुमान कार्य में, नेमोट्रॉन-नैनो-9बी-वी2 अपने अनुमान प्रक्रिया के ट्रैकिंग रिकॉर्ड को डिफ़ॉल्ट रूप से उत्पन्न कर सकता है, उपयोगकर्ता सरल नियंत्रण निर्देशों के माध्यम से, जैसे /think या /no_think, इस कार्य को स्विच कर सकते हैं। इसके अलावा, मॉडल ने "सोच बजट" प्रबंधन शुरू किया है, जो विकासकर्ताओं को अनुमान के लिए उपयोग किए जाने वाले अधिकतम टोकन संख्या के निर्धारण की अनुमति देता है, जिससे सटीकता और प्रतिक्रिया गति के बीच संतुलन बनाए रखा जा सकता है।

बेंचमार्क परीक्षण में, नेमोट्रॉन-नैनो-9बी-वी2 अच्छी सटीकता दिखाता है। उदाहरण के लिए, NeMo-Skills सेट के "अनुमान चालू" मोड में, यह मॉडल कई परीक्षणों में अच्छा प्रदर्शन करता है, जो अन्य छोटे ओपन सोर्स मॉडलों की तुलना में लाभ दिखाता है।

एनविडिया ने नेमोट्रॉन-नैनो-9बी-वी2 को खुले मॉडल लाइसेंस के साथ जारी किया है, जो व्यावसायिक उपयोग के लिए अनुमति देता है और विकासकर्ताओं को विकल्प मॉडल बनाने और फैलाने की आजादी देता है। ध्यान देने योग्य बात यह है कि एनविडिया मॉडल द्वारा उत्पादित आउटपुट के लिए मुक्त नहीं होता है, उपयोगकर्ता अपने उपयोग के पूर्ण नियंत्रण में रहते हैं।

इस मॉडल के जारी करने का उद्देश्य विकासकर्ताओं को छोटे वातावरण में अनुमान क्षमता और डेप्लॉयमेंट की दक्षता के बीच संतुलन के लिए उपकरण प्रदान करना है, जो एनविडिया के भाषा मॉडल की दक्षता और नियंत्रित अनुमान क्षमता में सुधार के लिए लगातार प्रयास को चिह्नित करता है।

huggingface:https://huggingface.co/nvidia/NVIDIA-Nemotron-Nano-9B-v2

मुख्य बिंदु:
🌟 एनविडिया ने नए छोटे भाषा मॉडल, नेमोट्रॉन-नैनो-9बी-वी2 का अनुमान कार्य के लिए उपयोगकर्ता लचीलापन से नियंत्रण कर सकते हैं।
⚙️ इस मॉडल के आधुनिक मिश्रित संरचना के आधार पर लंबे अनुक्रम की जानकारी के अधिक कुशल निपटान की अनुमति है, जो विभिन्न भाषा कार्यों के लिए उपयोगी है।
📊 नेमोट्रॉन-नैनो-9बी-वी2 खुले मॉडल लाइसेंस के साथ जारी किया गया है, जो विकासकर्ताओं के व्यावसायिक उपयोग और विकल्प मॉडल बनाने की अनुमति देता है।

नेमोट्रॉन-नैनो-9बी-वी2 एनविडिया ए10जीपीयू आईएमॉडल

यह लेख AIbase दैनिक से है

【AI दैनिक】 कॉलम में आपका स्वागत है! यहाँ आर्टिफ़िशियल इंटेलिजेंस की दुनिया का पता लगाने के लिए आपकी दैनिक मार्गदर्शिका है। हर दिन हम आपके लिए AI क्षेत्र की हॉट कंटेंट पेश करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, तकनीकी रुझानों को समझने में आपकी मदद करते हैं और अभिनव AI उत्पाद अनुप्रयोगों को समझते हैं।

—— AIbase दैनिक समूह द्वारा बनाया गया

360 दुनिया के पहले L2-L4 स्टैक बुद्धिमान प्लेटफॉर्म के लॉन्च के साथ! सरकारी और उद्यमी एआई बदलाव के ओपन-बॉक्स-इन-इस्तेमाल के युग में प्रवेश करते हैं

360 ग्रुप ने एंटरप्राइज AI प्लेटफॉर्म लॉन्च किया, जो L2 से L4 तक की क्षमताओं वाला दुनिया का पहला ऑपरेटिंग सिस्टम है। SEAF फैक्ट्री को अपग्रेड करके सरकार और व्यवसायों के लिए वन-स्टॉप AI समाधान प्रदान करता है।....

Oct 29, 2025

110

मिनीमैक्स द्वारा M2 अनुमान बड़े मॉडल प्रस्तुत किया गया: 230 बिलियन पैरामीटर, 100 टोकन/सेकंड स्मार्ट एजेंट के लिए डिज़ाइन किया गया

MiniMax ने नया ओपन-सोर्स मॉडल M2 लॉन्च किया, जो 2300 अरब पैरामीटर्स के साथ स्मार्ट एजेंट के लिए डिज़ाइन किया गया है। यह प्रति सेकंड 100 टोकन की तेज़ गति से काम करता है, जो रीयल-टाइम इंटरेक्शन के लिए आदर्श है।....

Oct 28, 2025

140

मिनीमैक ओपन सोर्स M2 मॉडल: उच्च प्रदर्शन आईएआई कोडिंग और एजेंट सक्षम है, प्रतिद्वंद्वी के केवल 8% लागत

2025 के 27 अक्टूबर को, मिनीमैक बड़ा भाषा मॉडल मिनीमैक M2 ओपन सोर्स किया गया। इस मॉडल का डिज़ाइन एजेंट कार्य प्रवाह और एंड-टू-एंड कोडिंग के लिए किया गया है, MoE आर्किटेक्चर का उपयोग करता है, दक्षता और प्रदर्शन उत्कृष्ट है: क्लॉड सोनेट के केवल 8% लागत, गति लगभग दो गुना बढ़ गई, डेवलपर्स और व्यवसाय के लिए लाभदायक आईएआई समाधान है।

Oct 27, 2025

AI छवि संपादन में अभूतपूर्व प्रगति! बाइट डाउन और हांग कॉन्ग में एक साथ स्वतंत्र ड्रीमोम्नी2 AI अब अमूर्त अवधारणाओं के बुझाने की समस्या हल करता है

बाइटडांस ने हांगकांग की तीन यूनिवर्सिटी के साथ मिलकर DreamOmni2 सिस्टम ओपन-सोर्स किया। यह AI इमेज एडिटिंग में क्रांतिकारी सुधार लाता है, टेक्स्ट और इमेज दोनों को एक साथ प्रोसेस करता है, जिससे इमेज जनरेशन तकनीक का विकास हो रहा है।....

Oct 27, 2025

150

मल्टीमोडल बड़े मॉडल के साथ ओपन एंजिन ने AI व्यवस्था के लिए तलवार दिखाई: 10 मिनट में 90% विज्ञापन की जांच, एक छमाही में 84 हजार अवैध सामग्री को रोका

जायंट इंजन ने AI विज्ञापन प्रबंधन मॉडल लॉन्च किया, जो AI-जनित जोखिमों से निपटने के लिए 'पूर्ण-लिंक प्रबंधन' और 'AI द्वारा AI प्रबंधन' रणनीति अपनाता है। यह मॉडल 90% विज्ञापन सामग्री को 10 मिनट में स्वचालित रूप से जांचता है, मानवीय गति से कहीं अधिक तेज़।....

Oct 27, 2025

130

AI दैनिक: टेंग्यून ने एक नई IMA2.0 जारी की; माइक्रोसॉफ्ट ने Copilot के साथ एक शक्तिशाली अपडेट जारी किया; अलीबाबा क्वार्क AI चश्मा डिलीवरी के लिए उपलब्ध है

【AI दैनिक】 चंद्रमा के अंधेरे ने Kimi k2 मॉडल के प्रदर्शन के लिए तारीफ मिली GPT-5 से आगे, और इस कंपनी ने अपने अगले नए खंड में सैकड़ों मिलियन डॉलर के निवेश के साथ करीब चार महीने में निवेश के बाद। घरेलू AI बड़े मॉडल क्षेत्र में लगातार गर्म है, डेवलपर्स प्लेटफॉर्म के माध्यम से नवीनतम उत्पाद अपडेट के बारे में जान सकते हैं।

Oct 24, 2025

180

विडू क्यू2 रेफरेंस स्टूडियो मास प्लेटफॉर्म पूरी तरह से एपीआई के लिए खुला है

हाल ही में, स्टूडियो ने विडू क्यू2 रेफरेंस वीडियो बड़ा मॉडल एपीआई के पूर्ण रूप से एक्सेस के लिए घोषणा की, जो आईए वीडियो जनरेशन तकनीक के 'उपयोगी' से 'शिल्प' तक अहम कदम को दर्शाता है। विडू क्यू2 अत्यधिक संगतता बनाए रखने में अद्वितीय मूल्य दिखाता है, विशेष रूप से विज्ञापन, उत्पाद प्रदर्शन के क्षेत्रों में, न केवल उत्पाद विवरण को बिल्कुल बरकरार रख सकता है, बल्कि आईए वीडियो में भावनात्मक प्रस्तुति को भी जोड़ सकता है, जो ब्रांड के प्रति प्रतिकूलता और उपयोगकर्ता रूपांतरण को बढ़ा सकता है। विडू क्यू2 के उत्सर्ग ने इंटरैक्टिव मनोरंजन, एनिमेशन, विज्ञापन ई-कॉमर्स उद्योग के लिए एक नई दिशा दी है।

Oct 23, 2025

140

बैजियांग ने नवीनतम चिकित्सा मॉडल M2Plus पेश किया, जो चिकित्सा भ्रम दर में गंभीर रूप से कम हो गई है

बैजियांग मॉडल ने चिकित्सा मॉडल Baichuan-M2Plus लॉन्च किया, जिसके अपनाने के लिए बैजियांग छोटा एसएस का अपग्रेड किया गया है और API इंटरफ़ेस खोला गया है। परीक्षण में, इस मॉडल की चिकित्सा भ्रम दर आम मॉडल की तुलना में गंभीर रूप से कम है, जो DeepSeek की तुलना में लगभग तीन गुना कम है, अमेरिकी OpenEvidence एप्लिकेशन के मुकाबले बेहतर प्रदर्शन करता है।

Oct 22, 2025

150

एआई डेली: ओपनएआई ने ब्राउज़र एटलस जारी किया; टॉंगई क्वेन 3-वीएल में 2 बिलियन, 32 बिलियन मॉडल साइज जोड़े गए; बाइशुन ने पुनरावर्ती साक्ष्य बढ़ाने वाले बड़े मॉडल जारी किए

OpenAI ने ChatGPT Atlas ब्राउज़र लॉन्च किया, जो AI असिस्टेंट के साथ Chrome को चुनौती देता है। हर टैब में एजेंट मोड से स्मार्ट इंटरैक्शन, इंटरनेट प्लेटफॉर्म बनने की महत्वाकांक्षा दिखाता है।....

Oct 22, 2025

बेनचुआन ने संचालित साक्ष्य बढ़ाने वाले मॉडल M2Plus जारी किया, डॉक्टर के लिए चैटजीपीटी बनाएं

बाइचुआन ने Baichuan-M2Plus मेडिकल मॉडल लॉन्च किया, जिसमें मेडिकल हॉल्यूसिनेशन दर सामान्य मॉडल्स से काफी कम है। यह DeepSeek से 3 गुना बेहतर और OpenEvidence को पीछे छोड़ता है। नई तकनीक से मेडिकल प्रश्नों के जवाबों की सटीकता बढ़ी है।....

Oct 22, 2025

140

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

GEO Brand Visibility

AI Brand Monitoring Tool

AI Search Visibility Checker

GEO Promotion Link Detection

GEO Ranking Optimization System

GEO Services

AI Model Compatibility Checker

AI Deployment Calculator

AIbase基地

यह लेख AIbase दैनिक से है

संबंधित AI समाचार अनुशंसाएँ

मिनीमैक ओपन सोर्स M2 मॉडल: उच्च प्रदर्शन आईएआई कोडिंग और एजेंट सक्षम है, प्रतिद्वंद्वी के केवल 8% लागत

विडू क्यू2 रेफरेंस स्टूडियो मास प्लेटफॉर्म पूरी तरह से एपीआई के लिए खुला है

बैजियांग ने नवीनतम चिकित्सा मॉडल M2Plus पेश किया, जो चिकित्सा भ्रम दर में गंभीर रूप से कम हो गई है

बेनचुआन ने संचालित साक्ष्य बढ़ाने वाले मॉडल M2Plus जारी किया, डॉक्टर के लिए चैटजीपीटी बनाएं

संबंधित AI समाचार अनुशंसाएँ

मिनीमैक ओपन सोर्स M2 मॉडल: उच्च प्रदर्शन आईएआई कोडिंग और एजेंट सक्षम है, प्रतिद्वंद्वी के केवल 8% लागत

विडू क्यू2 रेफरेंस स्टूडियो मास प्लेटफॉर्म पूरी तरह से एपीआई के लिए खुला है

बैजियांग ने नवीनतम चिकित्सा मॉडल M2Plus पेश किया, जो चिकित्सा भ्रम दर में गंभीर रूप से कम हो गई है

बेनचुआन ने संचालित साक्ष्य बढ़ाने वाले मॉडल M2Plus जारी किया, डॉक्टर के लिए चैटजीपीटी बनाएं

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

GEO Brand Visibility

AI Brand Monitoring Tool

AI Search Visibility Checker

GEO Promotion Link Detection

GEO Ranking Optimization System

GEO Services​

AI Model Compatibility Checker

AI Deployment Calculator

AIbase基地

यह लेख AIbase दैनिक से है

संबंधित AI समाचार अनुशंसाएँ

मिनीमैक ओपन सोर्स M2 मॉडल: उच्च प्रदर्शन आईएआई कोडिंग और एजेंट सक्षम है, प्रतिद्वंद्वी के केवल 8% लागत

विडू क्यू2 रेफरेंस स्टूडियो मास प्लेटफॉर्म पूरी तरह से एपीआई के लिए खुला है

बैजियांग ने नवीनतम चिकित्सा मॉडल M2Plus पेश किया, जो चिकित्सा भ्रम दर में गंभीर रूप से कम हो गई है

बेनचुआन ने संचालित साक्ष्य बढ़ाने वाले मॉडल M2Plus जारी किया, डॉक्टर के लिए चैटजीपीटी बनाएं

संबंधित AI समाचार अनुशंसाएँ

मिनीमैक ओपन सोर्स M2 मॉडल: उच्च प्रदर्शन आईएआई कोडिंग और एजेंट सक्षम है, प्रतिद्वंद्वी के केवल 8% लागत

विडू क्यू2 रेफरेंस स्टूडियो मास प्लेटफॉर्म पूरी तरह से एपीआई के लिए खुला है

बैजियांग ने नवीनतम चिकित्सा मॉडल M2Plus पेश किया, जो चिकित्सा भ्रम दर में गंभीर रूप से कम हो गई है

बेनचुआन ने संचालित साक्ष्य बढ़ाने वाले मॉडल M2Plus जारी किया, डॉक्टर के लिए चैटजीपीटी बनाएं

GEO Services