हाल ही में हुए SIGGRAPH अंतरराष्ट्रीय कंप्यूटर ग्राफिक्स और इंटरएक्शन तकनीक सम्मेलन में, नविडिया ने रोबोट विकासकर्ताओं के लिए एक श्रृंखला नई तकनीकों का प्रदर्शन किया, जिसमें सबसे आकर्षक उनके द्वारा पेश किया गया ओपन-सोर्स भौतिक AI मॉडल - Cosmos Reason था। इस मॉडल में 7 बिलियन पैरामीटर हैं, जो रोबोट को अधिक कुशल दृश्य अनुमान देने के लिए डिज़ाइन किया गया है।
नविडिया ने बताया कि OpenAI द्वारा CLIP मॉडल लॉन्च करने के बाद, दृश्य भाषा मॉडल कंप्यूटर दृश्य में उल्लेखनीय प्रगति कर रहे हैं, विशेष रूप से वस्तुओं की पहचान और पैटर्न पहचान जैसे कार्यों में। हालाँकि, पारंपरिक मॉडल कठिन बहु-चरण कार्यों के सामना करते समय अक्सर असमर्थ हो जाते हैं, विशेष रूप से अस्पष्ट या नए वास्तविक परिस्थितियों के साथ निपटने में। Cosmos Reason अपनी उत्कृष्ट स्मृति और समझ क्षमता के कारण, रोबोट को मनुष्य की तरह अनुमान लगाने में सक्षम बनाता है, जिससे वास्तविक दुनिया में अधिक तर्कसंगत कार्य निर्णय लेने में सक्षम हो जाता है।
नविडिया द्वारा प्रस्तुत वास्तविक अनुप्रयोग में, इस दृश्य अनुमान मॉडल के चलते रोबोट हाथ ने "ब्रेड + टोस्टर" के संयोजन की पहचान की और अगले चरण के रूप में ब्रेड को टोस्टर में डालने के लिए तार्किक अगला कदम निर्धारित किया। इस प्रक्रिया को "रोबोट प्लानिंग और रीजनिंग" कहा जाता है, जो Cosmos Reason के जटिल निर्देशों के साथ निपटने में उच्च कुशलता और लचीलापन को दर्शाता है।
रोबोट के "अनुमान दिमाग" के रूप में, Cosmos Reason अन्य AI क्षेत्रों में भी व्यापक रूप से उपयोग किया जा सकता है। उदाहरण के लिए, यह बड़े पैमाने पर, विविध शिक्षण डेटा सेट के संसाधन और टैगिंग के लिए स्वचालित रूप से काम कर सकता है। साथ ही, यह बड़े वीडियो डेटा से महत्वपूर्ण जानकारी निकाल सकता है और प्रभावी विश्लेषण कर सकता है। वर्तमान में, इस मॉडल को व्यावसायिक रूप से चलाया जा रहा है, और नविडिया के आंतरिक रोबोट और ऑटोनॉमस ड्राइविंग टीम इसका उपयोग डेटा संग्रह और टैगिंग कार्यों में कर रही है।
उल्लेखनीय रूप से, यूबर भी Cosmos Reason का उपयोग अपने ऑटोनॉमस ड्राइविंग शिक्षण डेटा के लिए टैगिंग और निर्देश बनाने के लिए कर रहा है। जबकि मैगना इंटरनेशनल इस मॉडल के माध्यम से पूर्ण ऑटोमेटिक तत्काल डिलीवरी समाधान विकसित कर रहा है, जिसका उद्देश्य वाहनों को नए शहरी वातावरण में तेजी से अनुकूलित करना है। इसके अलावा, VAST Data और Milestone Systems जैसी कंपनियां ट्रैफिक मॉनिटरिंग और दृश्य निरीक्षण जैसे क्षेत्रों में इस तकनीक का उपयोग कर रही हैं।
Cosmos Reason के अलावा, नविडिया ने Cosmos वर्ल्ड मॉडल में Cosmos Transfer-2 भी जोड़ा है, जिसका उद्देश्य 3D सिमुलेशन स्थितियों के संश्लेषित डेटा उत्पादन को तेज करना है। साथ ही, नविडिया ने Omniverse सॉफ्टवेयर डेवलपर्स किट के अपडेट किए गए और नए न्यूरल रिकन्स्ट्रक्शन लाइब्रेरी के साथ उपलब्ध कराए हैं, जिससे विकासकर्ताओं के लिए उपलब्ध टूल विकल्प बढ़ गए हैं।
मुख्य बातें:
1. 🤖 नविडिया द्वारा पेश किया गया Cosmos Reason मॉडल, रोबोट को दक्ष दृश्य अनुमान और जटिल निर्णय लेने में सक्षम बनाता है।
2. 🚗 इस मॉडल का उपयोग व्यावसायिक क्षेत्रों में किया जा रहा है, जैसे यूबर के ऑटोनॉमस ड्राइविंग डेटा टैगिंग और मैगना इंटरनेशनल के डिलीवरी समाधान।
3. 🛠️ नविडिया ने विकासकर्ता टूल अपडेट किए हैं, रोबोट तकनीक और AI के संयोजन को आगे बढ़ा रहा है।