1. आर्टिफिशियल इंटेलिजेंस (AI) प्रौद्योगिकी के तेजी से विकास के साथ, इंटरैक्टिव इंटेलिजेंस बन रहा है मोबाइल इंटरनेट का नया केंद्र। हाल ही में, थाईलैंड यूनिवर्सिटी के THUNLP लैब और मुख्यतः स्टेट्स इंटेलिजेंट (Facewall Intelligent) ने एक क्रांतिकारी ओपन सोर्स परियोजना - AgentCPM-GUI को जारी किया, जो विश्व का पहला चीनी ऐप्प के लिए विशेष रूप से अपग्रेड किया गया GUI (ग्राफिकल यूजर इंटरफेस) एजेंट है। इस परियोजना ने न केवल देशी AI प्रौद्योगिकी की मजबूत शक्ति को दिखाया, बल्कि अंड्रॉइड इकोसिस्टम के इंटेलिजेंट अपग्रेड के लिए नई राह पेश की है।
  2. image.png
  3. तकनीकी तूफान: पहला विशेष रूप से चीनी APP GUI एजेंट
  4. AgentCPM-GUI को Facewall Intelligent के MiniCPM-V मॉडल पर आधारित बनाया गया है, जिसका कुल पैरामीटर 8B (8 अरब) है। इस मॉडल को मोबाइल स्क्रीन इमेज के रूप में इनपुट दिया जाता है, जो इंटरफेस तत्वों को सटीक ढंग से पहचानता है और उपयोगकर्ता के निर्देशों को स्वचालित रूप से लागू करता है। परंपरागत सामान्य एजेंटों की तुलना में, AgentCPM-GUI ने चीनी APP के लिए गहरे अपग्रेड किए हैं, जिनमें गाओदेमैप, डायमांड रिव्यू, बिलीबिली, लिटल हीरो बुक्स जैसे 30 से अधिक प्रमुख चीनी एप्प कवर की है, जो उत्कृष्ट स्थानीयकरण क्षमता दिखाता है।
  5. image.png
  6. AIbase के अनुसार, इस एजेंट ने इंटरफेस तत्वों को पहचानने और कार्यों को करने में छात्र दिखाए हैं। उदाहरण के तौर पर, डेमो स्केनरियो में, AgentCPM-GUI बिलीबिली को तेजी से खोल सकता है और किसी विशेष UP के वीडियो जाँच कर सकता है, जो फ्लूइड और सटीक है। इस कार्य की प्राप्ति के लिए इसे चीनी APP इंटरफेस लॉजिक की गहरी समझ और प्रभावी एल्गोरिदम सेटिंग के पीछे वाला तत्व है।
  7. अद्यतन का इर्द-गिर्द: औसत कार्य की लंबाई केवल 9.7 Token
  8. इंटरफ़ेस शीर्षक पर, AgentCPM-GUI भी दिखाई देता है। उनावरण की उच्च प्रभावी क्षमता के माध्यम से, इस एजेंट ने औसत कार्य की लंबाई को 9.7 Token तक कम कर दिया है, जो कि कैल्क्यूलेटिंग रिसर्स का उपयोग कम करता है। इसका मतलब है कि एक साधारण Android डिवाइस पर भी, AgentCPM-GUI तेजी से प्रतिक्रिया और फ्लूइड रन कर सकता है, उपयोगकर्ताओं को निवेशित एप्प्स के समान अनुभव प्रदान करता है।
  9. AIbase द्वारा विचार किया जाता है कि इस उनावरण ने विकासकर्ताओं और उपयोगकर्ताओं के हार्डवेयर दराज को कम कर दिया है, और AgentCPM-GUI के अधिक उपभोक्ता इलेक्ट्रॉनिक डिवाइसों पर व्यापक तैनाती के लिए आधार पेश किया है। किसी भी स्मार्टफ़ोन, टैबलेट या अन्य स्मार्ट टर्मिनल पर, AgentCPM-GUI को इंटेलिजेंट इंटरैक्शन के मुख्य इंजन के रूप में पहचाना जा सकता है।
  10. ओपन सोर्स शक्ति: अंड्रॉइड इकोसिस्टम को इंटेलिजेंट करने के लिए अग्रेषण
  11. एक पूरी तरह से ओपन सोर्स परियोजना के रूप में, AgentCPM-GUI के प्रकाशन ने थाईलैंड यूनिवर्सिटी और मुख्यतः स्टेट्स इंटेलिजेंट के AI प्रौद्योगिकी के उपयोग की सुलभता पर कर्नल की ताकत को साबित कर दिया है। विकास टीम ने कहा है कि AgentCPM-GUI का कोड और संबंधित दस्तावेज़ खुले हैं, जिससे विकासकर्ता उनके आधार पर दूसरी तरफ से विकास कर सकते हैं। इस उपाय ने चीनी APP की इंटेलिजेंट इंटेलिजेंट इंटरैक्शन के विकास लागत को बहुत अधिक कम कर दिया है, और अधिक छोटे और मध्यम आकार के कंपनियों को इंटेलिजेंट इकोसिस्टम के निर्माण में शामिल होने में मदद की है।
  12. AIbase ने ध्यान दिया है कि AgentCPM-GUI का ओपन सोर्स परियोजना उद्यमी लोगों के बीच बड़ी रुचि पैदा कर रहा है। समुदाय के व्यक्तियों ने बताया है कि इस परियोजना ने चीनी GUI एजेंट क्षेत्र में रिक्तियाँ बनाई हैं, और विश्व भर के अंड्रॉइड इकोसिस्टम के इंटेलिजेंट विकास के लिए मूल्यपूर्ण संदर्भ पेश किया है। भविष्य में, अधिक विकासकर्ताओं के साथ शामिल होने से, AgentCPM-GUI गाओदेमैप, डायमांड रिव्यू जैसी प्रमुख APP की इंटरैक्शन अनुभव नई ऊंचाई पर आने की संभावना है।
  13. अनुप्रयोग के आगे: नेविगेशन से सोशल तक, इंटेलिजेंट बिना अन्त
  14. AgentCPM-GUI के आगमन ने चीनी APP के इंटेलिजेंट अनुप्रयोगों के लिए व्यापक जगह पेश की है। नेविगेशन स्केनरियो में, उपयोगकर्ता वोइस इन्स्ट्रक्शन देकर AgentCPM-GUI को गाओदेमैप का रास्ता निर्देशित करने पर प्रेरित कर सकते हैं; सोशल स्केनरियो में, Agent को लिटल हीरो बुक्स या बिलीबिली वीडियो को जल्दी से बारी करने और उपयोगकर्ता की आवश्यक जानकारी व्यक्त करने की क्षमता है; लाइफ सर्विस क्षेत्र में, डायमांड रिव्यू के रेस्टॉरेंट सुझाव और बुकिंग भी Agent के माध्यम से एक क्लिक में किया जा सकता है।
  15. AIbase अनुमान लगाता है कि AgentCPM-GUI के व्यापक उपयोग से, चीनी APP का उपयोगकर्ता अनुभव एक नई श्रेणी में उतरेगा। क्योंकि यह क्रियाकलाप दक्षता बढ़ाएगा, या व्यक्तिगत सेवाओं को और बेहतर बनाएगा, इस एजेंट उपयोगकर्ता और एप्प के बीच एक इंटेलिजेंट पुल के रूप में काम करेगा।
  16. देशी AI का मार्करियल ब्रेकथ्रू