माइक्रोसॉफ्ट बिल्ड डेवलपर कांग्रेस पर, माइक्रोसॉफ्ट ने अपने ओपन सोर्स परियोजना मेगैन्टिक-UI को जारी किया, जो एक आदमी-केंद्रित आर्टिफिशियल इंटेलिजेंस (AI) वेब प्रोक्सी सिस्टम है। यह नवाचारशील उपकरण क्षमतामय वेब परियोजनाओं को स्वचालित करने के लिए डिज़ाइन किया गया है, जबकि उपयोगकर्ता को पूरे प्रक्रिया के कंट्रोल रखने की सुविधा प्रदान करता है। AIbase ने इस तकनीकी अभियान के मुख्य लाभ और उसके संभावित प्रभाव का विस्तृत विश्लेषण किया है।

image.png

मेगैन्टिक-UI: मानव-मशीन सहयोगी वेब प्रोक्सी

मेगैन्टिक-UI, माइक्रोसॉफ्ट के मेगैन्टिक-ONE और AutoGen फ़्रेमवर्क के आधार पर विकसित ओपन सोर्स प्रोटोटाइप है, जिसका उद्देश्य वेब परियोजनाओं के स्वचालित करने में पारंपरिक AI प्रोक्सी के लापरवाही और उपयोगकर्ता नियंत्रण की कमी दूर करना है। इस सिस्टम में बहु-आइंटलिजेंट एजेंट के सहयोग से, यह वेब पर ब्राउज़, क्लिक, फ़ॉर्म भरना, फ़ाइल पढ़ना, कोड जनरेशन जैसी जटिल कार्यों को स्वचालित कर सकता है, जबकि अपने कार्यों के हर चरण को उपयोगकर्ता इंटरफ़ेस में स्पष्ट रूप से दिखाता है।

पारंपरिक ऑटोमेटेड AI प्रोक्सी के विपरीत, मेगैन्टिक-UI "मानव-केंद्रित" डिज़ाइन की पहल करता है। यूज़र ने कार्य के लक्ष्य दिए हैं, तो प्रणाली विस्तृत कार्य योजना (जैसे, टोडो लिस्ट) बनाती है, जिसे उपयोगकर्ता समय-पर-समय संपादित, हटा सकते हैं या क्रम को बदल सकते हैं, या फिर कार्य को पूर्ण रूप से पूरा करने से पहले पूर्वानुमान दिए बिना पूर्वावलोकन कर सकते हैं। इस सहयोगी मॉडल ने ऑटोमेटेशन दक्षता और उपयोगकर्ता के नियंत्रण के बीच एक संतुलन प्रदान किया है।

image.png

पारदर्शी और सुरक्षा: उपयोगकर्ता को हमेशा नियंत्रण हासिल

मेगैन्टिक-UI की विशेषता उपयोगकर्ता के भरोसे और सुरक्षा पर ध्यान केंद्रित करने में है। प्रणाली में एक विज़ुअलाइज़ेशन टास्क पैनल शामिल है, जो प्रत्येक चरण को रियल-टाइम में दिखाता है, जैसे कि बटन क्लिक, पेज खोलना या संदेश भेजना। उलझाव उत्पन्न कर सकने वाली किसी भी अपरतिरोधी ऑपरेशन को (जैसे, ऑनलाइन किनवा शॉपिंग कार्ट में जोड़ना) उपयोगकर्ता के स्पष्ट अनुमोदन की आवश्यकता होती है। उपयोगकर्ता घटनाओं के लिए व्हाइटलिस्ट बना सकते हैं, जो प्रोक्सी को किन वेबसाइटों को छोड़ दें, इससे और अधिक सुरक्षा प्रदान की जा सकती है।

इसके अलावा, मेगैन्टिक-UI "प्लान लर्निंग" का समर्थन करता है। प्रणाली टास्क के लागू होने के चरणों को टेम्पलेट के रूप में याद रखती है और उन्हें बाद के उल्लेखित कार्यों के लिए पुनः-उपयोग कर सकती है, जिससे प्रणाली उपयोग के साथ-साथ अपनी प्रदर्शन को बेहतर बना सकती है। माइक्रोसॉफ्ट ने GAIA बेसलाइन टेस्ट में मेगैन्टिक-UI के प्रदर्शन की जांच की, जिसमें 162 परियोजनाओं के जटिल कार्यों में स्वतः पूर्णांक तकनीक की दर 30.3% थी, जो इसकी बहु-मॉडल क्षमता के बहुत मजबूत प्रदर्शन का प्रतिनिधित्व करती है।

बहु-आइंटलिजेंट आर्किटेक्चर: FireSurfer और Docker के उपयोग

मेगैन्टिक-UI, माइक्रोसॉफ्ट के स्वयंकृत Magentic-One फ़्रेमवर्क पर आधारित है, जो बहु-आइंटलिजेंट एजेंटों के सहयोगी कार्य के मॉडल का प्रयोग करता है, जिसमें FireSurfer प्रोक्सी शामिल है, जो फ़ाइल कनवर्टर और कोड एक्सेक्यूशन जैसी जटिल ऑपरेशन प्रबंधित करता है। प्रणाली Docker कंटेनर वातावरण में चलती है, जो सुरक्षा और स्थिरता के लिए अलग करने का उपयोग करता है। इस आर्किटेक्चर ने प्रणाली की लचीलापन बढ़ाई है, और डेवलपर्स के लिए अनेक प्रसंस्करण उपलब्ध कराई है।

उदाहरण के लिए, यदि उपयोगकर्ता "मेरे लिए उड़ान की जांच करें" कहता है, तो मेगैन्टिक-UI स्वचालित रूप से यह कार्य योजना बनाएगा: उड़ान की जांच करने वाली वेबसाइट को खोलें, निर्दिष्ट समयांतराल में उड़ानों की खोज करें, और किराए की जांच करें। उपयोगकर्ता फिर इस परियोजना को संशोधित कर सकते हैं, जैसे कि "केवल सीधी उड़ानें दिखाएं" की शर्त को जोड़ें, तो प्रणाली निर्दिष्ट आदेश के अनुसार यह कार्य करेगी।

ओपन सोर्स इकोसिस्टम: डेवलपर्स और कम्युनिटी के लिए नई जरूरतें

एक पूरी तरह से ओपन सोर्स परियोजना के रूप में, मेगैन्टिक-UI GitHub पर जारी किया गया है, जिसका प्रयोग MIT लाइसेंस के तहत किया जा सकता है, जिससे बहुत सारे डेवलपर्स और शोधकर्ताओं का ध्यान आकर्षित हुआ है। इस प्रोजेक्ट के प्रदर्शन के बाद काफी कम समय में सैकड़ों स्टार प्राप्त हुईं, जो कम्युनिटी के इस प्रोजेक्ट के प्रति अच्छी तरह से रिपोर्ट करती है। माइक्रोसॉफ्ट ने ओपन सोर्स के माध्यम से विश्वभर के डेवलपर्स को इस मानव-मशीन सहयोगी AI प्रोक्सी प्रणाली को सुधारने के लिए प्रेरित किया है, जिससे "ऑपन एजेंट नेटवर्क" (Agentic Web) का निर्माण तेजी से हो सके।

माइक्रोसॉफ्ट के चीफ टेक्नोलॉजी ऑफिसर, केविन स्कॉट ने कहा है कि मेगैन्टिक-UI, "एजेंट नेटवर्क" की एक महत्वपूर्ण चरण है, जहाँ AI प्रोक्सी अन्य प्लेटफ़ॉर्मों के बीच बिना कठिनाई के सहज संयोजित हो सकेंगे और जटिल कार्यों को ऑटोमेट कर सकेंगे।

उपयोग स्केल: व्यक्तिगत दक्षता से व्यापारिक परिवर्तन तक