अमेज़ॅन ने सोमवार को नोवा ऐक्ट लॉन्च किया, जो एक सामान्य AI एजेंट है जो वेब ब्राउज़र को नियंत्रित कर सकता है और स्वतंत्र रूप से सरल कार्यों को निष्पादित कर सकता है। इसके साथ ही नोवा ऐक्ट SDK भी लॉन्च किया गया है, जो डेवलपर्स को नोवा ऐक्ट का उपयोग करके एजेंट प्रोटोटाइप बनाने की अनुमति देता है।
नोवा ऐक्ट को अमेज़ॅन के सैन फ़्रांसिस्को में नए स्थापित AGI लैब द्वारा विकसित किया गया है, जो कंपनी के आगामी एलेक्सा+ (अमेज़ॅन वॉयस असिस्टेंट का जनरेटिव AI-संवर्धित संस्करण) के लिए महत्वपूर्ण कार्यक्षमता प्रदान करेगा। हालाँकि, वर्तमान में जारी किया गया नोवा ऐक्ट संस्करण "रिसर्च प्रीव्यू" के रूप में स्थित है, और डेवलपर्स nova.amazon.com वेबसाइट के माध्यम से नोवा ऐक्ट टूलकिट तक पहुँच सकते हैं।
यह उत्पाद ओपनएआई के ऑपरेटर और एंथ्रोपिक के कंप्यूटर यूज़ के साथ अमेज़ॅन की स्पष्ट प्रतिस्पर्धा है। कई तकनीकी दिग्गजों का मानना है कि वेब पर उपयोगकर्ताओं को नेविगेट करने में सक्षम AI एजेंट वर्तमान AI चैटबॉट्स की उपयोगिता में काफी वृद्धि करेंगे। हालाँकि अमेज़ॅन इस क्षेत्र का अग्रणी नहीं है, लेकिन एलेक्सा+ के माध्यम से, इसका कवरेज सबसे व्यापक हो सकता है।
अमेज़ॅन के अनुसार, डेवलपर्स नोवा ऐक्ट SDK का उपयोग करके उपयोगकर्ताओं के लिए ऑटोमेटेड बेसिक ऑपरेशंस जैसे ऑनलाइन ऑर्डरिंग या बुकिंग लागू कर सकते हैं। टूलकिट कई कार्यों को एकीकृत करने का समर्थन करता है, जिससे AI एजेंट वेब पेज ब्राउज़ कर सकते हैं, फ़ॉर्म भर सकते हैं या कैलेंडर पर तिथियाँ चुन सकते हैं।
अमेज़ॅन का दावा है कि आंतरिक परीक्षणों में नोवा ऐक्ट ने अपने प्रतिस्पर्धियों को पछाड़ दिया है। स्क्रीनस्पॉट वेब टेक्स्ट मूल्यांकन में, नोवा ऐक्ट ने 94% स्कोर किया, जो ओपनएआई के CUA (88%) और एंथ्रोपिक के Claude3.7Sonnet (90%) से आगे है। हालाँकि, अमेज़ॅन ने नोवा ऐक्ट के लिए वेबवॉयेजर जैसे अधिक सामान्य एजेंट मूल्यांकन का उपयोग नहीं किया।
नोवा ऐक्ट पूर्व ओपनएआई शोधकर्ता डेविड लुआन और पीटर एबेले के नेतृत्व में AGI लैब का पहला सार्वजनिक उत्पाद है। दोनों ने अपनी AI स्टार्टअप कंपनियों की स्थापना की थी - लुआन ने एडेप्ट की स्थापना की, एबेले ने कोवेरिएंट की सह-स्थापना की - जिन्हें पिछले साल अमेज़ॅन ने अपने AI एजेंट कार्य का नेतृत्व करने के लिए नियुक्त किया था।
लुआन ने TechCrunch को बताया कि उनका मानना है कि एजेंट सुपर-इंटेलिजेंट AI सिस्टम बनाने के लिए एक महत्वपूर्ण कदम हैं, और उन्होंने AGI को "एक AI सिस्टम के रूप में परिभाषित किया जो कंप्यूटर पर मनुष्यों द्वारा किए जाने वाले हर काम में मदद कर सकता है"। उन्होंने कहा कि टीम ने नोवा ऐक्ट SDK को छोटे कार्यों को विश्वसनीय रूप से स्वचालित करने और डेवलपर्स को सटीक रूप से परिभाषित करने में सक्षम बनाने के लिए डिज़ाइन किया है कि वर्कफ़्लो में कब मानवीय हस्तक्षेप की आवश्यकता है।
प्रारंभिक AI एजेंटों के सामने मुख्य चुनौती क्रॉस-डोमेन विश्वसनीयता रही है। परीक्षणों में, मौजूदा सिस्टम आम तौर पर धीमे, लंबे समय तक स्वतंत्र रूप से संचालित करने में असमर्थ और मनुष्यों द्वारा की जाने वाली गलतियों से अलग गलतियाँ करने के लिए प्रवृत्त पाए गए हैं। बाजार जल्द ही देखेगा कि क्या अमेज़ॅन ने इन बाधाओं को पार कर लिया है, या क्या इसके एजेंट भी अपने प्रतिस्पर्धियों को परेशान करने वाली समान समस्याओं से ग्रस्त हैं।