आज, X-PLUG टीम ने GitHub पर अपनी नई परियोजना Mobile-Agent-v3 का आधिकारिक रूप से उद्घाटन किया है, जो GUI-Owl पर आधारित एक क्रॉस-प्लेटफॉर्म मल्टी-एजेंट फ्रेमवर्क है। Mobile-Agent-v3 के बुनियादी योजना, गति प्रबंधन, पुनर्विचार और स्मृति क्षमता है, जिसका उद्देश्य उपयोगकर्ताओं के GUI ऑटोमेशन अनुभव को सुधारना है।

GUI-Owl Mobile-Agent-v3 के मूल मॉडल के रूप में, इसमें संवेदन, बुनियादी, तर्क, योजना और कार्यान्वयन कई क्षमताओं के संयोजन है, जो एक मूल बिंदु से बिंदु तक बहुमाध्यमिक एजेंट है। इसके डिज़ाइन के कारण क्रॉस-प्लेटफॉर्म अंतरक्रिया और कई बार निर्णय लेना अधिक सुचारू हो गया है, जिसमें स्पष्ट मध्यवर्ती तर्क क्षमता है। इसका मतलब यह है कि जब उपयोगकर्ता कई कार्यों के साथ काम करते हैं, तो उन्हें अधिक स्थिर प्रदर्शन प्राप्त होता है।

QQ20250825-112403.png

X-PLUG टीम ने विशेष रूप से उल्लेख किया कि Mobile-Agent-v3 फ़ंक्शन में अपग्रेड किया गया है, साथ ही असामान्य प्रबंधन और पुनर्विचार क्षमता को मजबूत किया गया है, जिससे विज़ार्ड और विज्ञापन जैसी बाधाओं के सामने भी उच्च प्रभावशीलता बनी रहती है। इसके अलावा, Mobile-Agent-v3 की महत्वपूर्ण जानकारी रिकॉर्डिंग क्षमता, एप्लिकेशन के बीच कार्य के क्रम को अधिक सुविधाजनक बनाती है, जो उपयोगकर्ताओं के दैनिक कार्य को बहुत आसान बना देती है।

साथ ही, Mobile-Agent के कई पूर्व संस्करण, जैसे Mobile-Agent-v2 और PC-Agent, क्रमशः NeurIPS2024 और ICLR2025 के सम्मेलनों में स्वीकृत किए गए हैं, जो इस परियोजना के वैज्ञानिक अनुसंधान क्षेत्र में व्यापक प्रभाव को दर्शाता है।

उल्लेखनीय बात यह है कि X-PLUG टीम ने Mobile-Agent की छात्र के लिए विस्तृत संसाधन समर्थन प्रदान किया है, जिसमें तकनीकी रिपोर्ट, प्रदर्शन वीडियो और कोड लाइब्रेरी शामिल हैं, जिससे विकासकर्ता और अनुसंधानकर्ता Mobile-Agent के संभावनाओं की गहराई से खोज कर सकते हैं। इन संसाधनों के माध्यम से, उपयोगकर्ता न केवल Mobile-Agent की शक्ति का अनुभव कर सकते हैं, बल्कि इसके बाद के विकास और अपग्रेड में भाग ले सकते हैं।

पता: https://github.com/X-PLUG/MobileAgent