हाल ही में हुए RL China 2025 के उद्घाटन समारोह पर, लंदन विश्वविद्यालय के प्रोफेसर वांग जून ने "प्रबलन अधिग्रहण के जनक" Richard Sutton के साथ गहरी बातचीत की, जिसमें बुद्धिमत्ता की प्रकृति और भविष्य के विकास के बारे में चर्चा की गई। वांग जून प्रोफेसर बुद्धिमान सूचना प्रणाली के क्षेत्र में एक प्रामाणिक व्यक्ति हैं, और सैटन के साथ वे प्रबलन अधिग्रहण (RL) के विषय की मूल बुनियाद की समीक्षा करते हैं और वर्तमान में कृत्रिम बुद्धिमत्ता उद्योग के तेजी से विस्तार के मूल वैज्ञानिक अनुसंधान पर प्रभाव पर ध्यान केंद्रित करते हैं।
सैटन ने कहा कि वर्तमान कृत्रिम बुद्धिमत्ता प्रौद्योगिकी, विशेष रूप से बड़े पैमाने पर भाषा मॉडल (LLM), व्यावहारिक अनुप्रयोग में शक्तिशाली क्षमता दिखाते हैं, लेकिन बुद्धिमत्ता की वास्तविक समझ का रास्ता नहीं है। उन्होंने जोर देकर कहा कि LLM के प्रशिक्षण के बाद उनकी सीखने की क्षमता समाप्त हो जाती है, क्योंकि उन्हें स्पष्ट लक्ष्य और पुरस्कार तंत्र की कमी होती है। इसके विपरीत, प्रबलन अधिग्रहण वातावरण के साथ अंतरक्रिया के माध्यम से लक्ष्य तक पहुंचने पर जोर देता है, जिसके माध्यम से बुद्धिमत्ता के कार्यान्वयन की बेहतर समझ और अनुकरण संभव होता है।
सैटन ने बताया कि वास्तविक बुद्धिमत्ता के लिए लक्ष्य की स्पष्ट परिभाषा की आवश्यकता होती है, जिसे "पुरस्कार" संकेत द्वारा शिक्षा के लिए प्रेरित किया जाता है। उनका मानना है कि अनुभव से सीखना प्रबलन अधिग्रहण का केंद्र है, और केवल ग्रेडिएंट डिसेंट जैसी एक विधि पर निर्भर नहीं होता है। बुद्धिमत्ता के विकास के लिए अनुसंधानकर्ताओं को खोज और ग्रेडिएंट डिसेंट के संयोजन के साथ अधिक संभावनाओं की खोज करनी चाहिए। उन्होंने यह भी जोर देकर कहा कि जबकि उद्योग में पूंजी के प्रवेश अनुप्रयोग विकास को बढ़ावा देते हैं, यह वैज्ञानिक अनुसंधान को लंबे समय के लक्ष्य से हटाने के लिए नहीं होना चाहिए।
कम उम्र के अनुसंधानकर्ताओं के लिए सैटन ने आशीर्वाद दिया, जिसमें उन्होंने आधुनिक विज्ञान पर ध्यान केंद्रित करने के लिए उनकी प्रेरणा दी, जो कृत्रिम बुद्धिमत्ता की खोज एक लंबी प्रक्रिया है, जो तुरंत हल नहीं किया जा सकता है। उन्होंने कहा कि जबकि उद्योग वर्तमान में हासिल करने योग्य तकनीक पर ध्यान केंद्रित करता है, वैज्ञानिक समुदाय को बुद्धिमत्ता की वास्तविक समझ के लिए अभी तक हल नहीं किए गए मूल समस्याओं के अन्वेषण में लगे रहने की आवश्यकता है।
इस बातचीत ने हमें याद दिलाया कि तकनीकी प्रगति की ओर बढ़ते समय, बुद्धिमत्ता की प्रकृति के गहरे अध्ययन को अनदेखा नहीं करना चाहिए।