मैसाचुसेट्स इंस्टीट्यूट ऑफ टेक्नोलॉजी (MIT) ने इस सप्ताह एक नई रोबोट प्रशिक्षण मॉडल पेश किया है, जो पहले के विशेष डेटा सेट पर केंद्रित प्रशिक्षण विधियों को छोड़कर बड़े भाषा मॉडल (LLMs) के प्रशिक्षण में उपयोग की जाने वाली विशाल जानकारी को अपनाता है।
शोधकर्ताओं ने बताया कि अनुकरणीय सीखना - यानी एजेंट द्वारा कार्यों को अनुकरण करके सीखना - छोटे-छोटे चुनौतियों का सामना करते समय विफल हो सकता है। ये चुनौतियाँ विभिन्न प्रकाश स्थितियों, विभिन्न पर्यावरण सेटिंग्स या नए बाधाओं को शामिल कर सकती हैं। इन स्थितियों में, रोबोट के पास इन परिवर्तनों के अनुकूल होने के लिए पर्याप्त डेटा नहीं होता है।
चित्र स्रोत नोट: चित्र AI द्वारा निर्मित, चित्र लाइसेंस प्रदाता Midjourney द्वारा
टीम ने GPT-4 जैसे मॉडलों से प्रेरणा लेते हुए एक डेटा-संचालित समस्या समाधान दृष्टिकोण अपनाया।
“भाषा के क्षेत्र में, डेटा वाक्य होते हैं,” इस शोध पत्र के मुख्य लेखक लिरुई वांग ने कहा। “रोबोटिक्स के क्षेत्र में, डेटा की विविधता को देखते हुए, यदि आप इसी तरह पूर्व-प्रशिक्षण करना चाहते हैं, तो हमें विभिन्न संरचनाओं की आवश्यकता है।”
टीम ने एक नई संरचना पेश की, जिसे हेटेरोजीनियस प्री-ट्रेनिंग ट्रांसफार्मर (HPT) कहा जाता है, जो विभिन्न सेंसर और विभिन्न पर्यावरण से जानकारी को एकीकृत करता है। फिर डेटा को प्रशिक्षण मॉडल में एकीकृत करने के लिए ट्रांसफार्मर का उपयोग किया जाता है। ट्रांसफार्मर जितना बड़ा होगा, आउटपुट परिणाम उतना ही बेहतर होगा।
उपयोगकर्ता फिर रोबोट के डिज़ाइन, कॉन्फ़िगरेशन और वे जो कार्य पूरा करना चाहते हैं, उसे इनपुट करते हैं।
“हमारा सपना एक सामान्य रोबोट मस्तिष्क होना है, जिसे आप डाउनलोड कर सकते हैं और अपने रोबोट के लिए उपयोग कर सकते हैं, बिना किसी प्रशिक्षण के,” कार्नेगी मेलॉन विश्वविद्यालय के सहायक प्रोफेसर डेविड हेल्ड ने इस शोध के बारे में बात करते हुए कहा। “हालांकि हम अभी शुरुआत कर रहे हैं, लेकिन हम आगे बढ़ते रहेंगे, उम्मीद है कि पैमाने का विस्तार बड़े भाषा मॉडलों की तरह रोबोट रणनीतियों में breakthroughs लाएगा।”
यह शोध आंशिक रूप से टोयोटा रिसर्च इंस्टीट्यूट द्वारा वित्त पोषित है। पिछले वर्ष टेकक्रंच डिसरप्ट में, TRI ने एक रात में रोबोट को प्रशिक्षित करने की विधि का प्रदर्शन किया। हाल ही में, इसने अपने रोबोटिक्स सीखने के शोध को बोस्टन डायनेमिक्स के हार्डवेयर के साथ मिलाने के लिए एक ऐतिहासिक साझेदारी की है।