- आर्टिफिशियल इंटेलिजेंस (AI) प्रौद्योगिकी के तेजी से विकास के साथ, इंटरैक्टिव इंटेलिजेंस बन रहा है मोबाइल इंटरनेट का नया केंद्र। हाल ही में, थाईलैंड यूनिवर्सिटी के THUNLP लैब और मुख्यतः स्टेट्स इंटेलिजेंट (Facewall Intelligent) ने एक क्रांतिकारी ओपन सोर्स परियोजना - AgentCPM-GUI को जारी किया, जो विश्व का पहला चीनी ऐप्प के लिए विशेष रूप से अपग्रेड किया गया GUI (ग्राफिकल यूजर इंटरफेस) एजेंट है। इस परियोजना ने न केवल देशी AI प्रौद्योगिकी की मजबूत शक्ति को दिखाया, बल्कि अंड्रॉइड इकोसिस्टम के इंटेलिजेंट अपग्रेड के लिए नई राह पेश की है।
- तकनीकी तूफान: पहला विशेष रूप से चीनी APP GUI एजेंट
- AgentCPM-GUI को Facewall Intelligent के MiniCPM-V मॉडल पर आधारित बनाया गया है, जिसका कुल पैरामीटर 8B (8 अरब) है। इस मॉडल को मोबाइल स्क्रीन इमेज के रूप में इनपुट दिया जाता है, जो इंटरफेस तत्वों को सटीक ढंग से पहचानता है और उपयोगकर्ता के निर्देशों को स्वचालित रूप से लागू करता है। परंपरागत सामान्य एजेंटों की तुलना में, AgentCPM-GUI ने चीनी APP के लिए गहरे अपग्रेड किए हैं, जिनमें गाओदेमैप, डायमांड रिव्यू, बिलीबिली, लिटल हीरो बुक्स जैसे 30 से अधिक प्रमुख चीनी एप्प कवर की है, जो उत्कृष्ट स्थानीयकरण क्षमता दिखाता है।
- AIbase के अनुसार, इस एजेंट ने इंटरफेस तत्वों को पहचानने और कार्यों को करने में छात्र दिखाए हैं। उदाहरण के तौर पर, डेमो स्केनरियो में, AgentCPM-GUI बिलीबिली को तेजी से खोल सकता है और किसी विशेष UP के वीडियो जाँच कर सकता है, जो फ्लूइड और सटीक है। इस कार्य की प्राप्ति के लिए इसे चीनी APP इंटरफेस लॉजिक की गहरी समझ और प्रभावी एल्गोरिदम सेटिंग के पीछे वाला तत्व है।
- अद्यतन का इर्द-गिर्द: औसत कार्य की लंबाई केवल 9.7 Token
- इंटरफ़ेस शीर्षक पर, AgentCPM-GUI भी दिखाई देता है। उनावरण की उच्च प्रभावी क्षमता के माध्यम से, इस एजेंट ने औसत कार्य की लंबाई को 9.7 Token तक कम कर दिया है, जो कि कैल्क्यूलेटिंग रिसर्स का उपयोग कम करता है। इसका मतलब है कि एक साधारण Android डिवाइस पर भी, AgentCPM-GUI तेजी से प्रतिक्रिया और फ्लूइड रन कर सकता है, उपयोगकर्ताओं को निवेशित एप्प्स के समान अनुभव प्रदान करता है।
- AIbase द्वारा विचार किया जाता है कि इस उनावरण ने विकासकर्ताओं और उपयोगकर्ताओं के हार्डवेयर दराज को कम कर दिया है, और AgentCPM-GUI के अधिक उपभोक्ता इलेक्ट्रॉनिक डिवाइसों पर व्यापक तैनाती के लिए आधार पेश किया है। किसी भी स्मार्टफ़ोन, टैबलेट या अन्य स्मार्ट टर्मिनल पर, AgentCPM-GUI को इंटेलिजेंट इंटरैक्शन के मुख्य इंजन के रूप में पहचाना जा सकता है।
- ओपन सोर्स शक्ति: अंड्रॉइड इकोसिस्टम को इंटेलिजेंट करने के लिए अग्रेषण
- एक पूरी तरह से ओपन सोर्स परियोजना के रूप में, AgentCPM-GUI के प्रकाशन ने थाईलैंड यूनिवर्सिटी और मुख्यतः स्टेट्स इंटेलिजेंट के AI प्रौद्योगिकी के उपयोग की सुलभता पर कर्नल की ताकत को साबित कर दिया है। विकास टीम ने कहा है कि AgentCPM-GUI का कोड और संबंधित दस्तावेज़ खुले हैं, जिससे विकासकर्ता उनके आधार पर दूसरी तरफ से विकास कर सकते हैं। इस उपाय ने चीनी APP की इंटेलिजेंट इंटेलिजेंट इंटरैक्शन के विकास लागत को बहुत अधिक कम कर दिया है, और अधिक छोटे और मध्यम आकार के कंपनियों को इंटेलिजेंट इकोसिस्टम के निर्माण में शामिल होने में मदद की है।
- AIbase ने ध्यान दिया है कि AgentCPM-GUI का ओपन सोर्स परियोजना उद्यमी लोगों के बीच बड़ी रुचि पैदा कर रहा है। समुदाय के व्यक्तियों ने बताया है कि इस परियोजना ने चीनी GUI एजेंट क्षेत्र में रिक्तियाँ बनाई हैं, और विश्व भर के अंड्रॉइड इकोसिस्टम के इंटेलिजेंट विकास के लिए मूल्यपूर्ण संदर्भ पेश किया है। भविष्य में, अधिक विकासकर्ताओं के साथ शामिल होने से, AgentCPM-GUI गाओदेमैप, डायमांड रिव्यू जैसी प्रमुख APP की इंटरैक्शन अनुभव नई ऊंचाई पर आने की संभावना है।
- अनुप्रयोग के आगे: नेविगेशन से सोशल तक, इंटेलिजेंट बिना अन्त
- AgentCPM-GUI के आगमन ने चीनी APP के इंटेलिजेंट अनुप्रयोगों के लिए व्यापक जगह पेश की है। नेविगेशन स्केनरियो में, उपयोगकर्ता वोइस इन्स्ट्रक्शन देकर AgentCPM-GUI को गाओदेमैप का रास्ता निर्देशित करने पर प्रेरित कर सकते हैं; सोशल स्केनरियो में, Agent को लिटल हीरो बुक्स या बिलीबिली वीडियो को जल्दी से बारी करने और उपयोगकर्ता की आवश्यक जानकारी व्यक्त करने की क्षमता है; लाइफ सर्विस क्षेत्र में, डायमांड रिव्यू के रेस्टॉरेंट सुझाव और बुकिंग भी Agent के माध्यम से एक क्लिक में किया जा सकता है।
- AIbase अनुमान लगाता है कि AgentCPM-GUI के व्यापक उपयोग से, चीनी APP का उपयोगकर्ता अनुभव एक नई श्रेणी में उतरेगा। क्योंकि यह क्रियाकलाप दक्षता बढ़ाएगा, या व्यक्तिगत सेवाओं को और बेहतर बनाएगा, इस एजेंट उपयोगकर्ता और एप्प के बीच एक इंटेलिजेंट पुल के रूप में काम करेगा।
- देशी AI का मार्करियल ब्रेकथ्रू
टिंग्वाह ने मुख्यतः कार्यक्रम से खुली लिखित बातें की! पहला चीनी एप्प विशेषकर GUI Agent को कवर करती है, जो गोड और B-साइट, लिटिल रेड बुक का प्रबंधन करती है

AIbase基地
यह लेख AIbase दैनिक से है
【AI दैनिक】 कॉलम में आपका स्वागत है! यहाँ आर्टिफ़िशियल इंटेलिजेंस की दुनिया का पता लगाने के लिए आपकी दैनिक मार्गदर्शिका है। हर दिन हम आपके लिए AI क्षेत्र की हॉट कंटेंट पेश करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, तकनीकी रुझानों को समझने में आपकी मदद करते हैं और अभिनव AI उत्पाद अनुप्रयोगों को समझते हैं।