कृत्रिम बुद्धिमत्ता के तेजी से विकसित होते क्षेत्र में, कुछ छात्रों द्वारा स्थापित एक मंच चुपचाप खेल के नियमों को बदल रहा है। Chatbot Arena न केवल दुनिया के सबसे प्रमुख AI सिस्टम परीक्षण प्लेटफार्मों में से एक बन गया है, बल्कि यह तकनीकी दिग्गजों के बीच मुकाबले का एक महत्वपूर्ण मैदान भी बन गया है।

यह परियोजना, जिसे कैलिफोर्निया विश्वविद्यालय बर्कले, स्टैनफोर्ड विश्वविद्यालय और कैलिफोर्निया विश्वविद्यालय सैन डिएगो के छात्रों ने 2023 में अप्रैल में संयुक्त रूप से लॉन्च किया, ने पारंपरिक AI तकनीकी परीक्षण को एक अनूठे तरीके से बाधित किया है। पिछले नीरस गणित और कानूनी परीक्षणों के विपरीत, Chatbot Arena ने एक अत्यंत सरल और अंतर्दृष्टिपूर्ण विधि अपनाई है: उपयोगकर्ताओं को दो AI मॉडल की प्रतिक्रियाओं की गुमनाम तुलना करने देना और बेहतर उत्तर के लिए मतदान करने देना।

कृत्रिम बुद्धिमत्ता AI शिक्षा

चित्र स्रोत टिप्पणी: चित्र AI द्वारा उत्पन्न, चित्र अधिकार सेवा प्रदाता Midjourney

शुरुआत में 9 मॉडल से बढ़कर अब 170 से अधिक हो गए हैं, और 200 लाख से अधिक मतपत्रों के साथ, इस परियोजना ने OpenAI, Google, Meta जैसे तकनीकी दिग्गजों का ध्यान तेजी से आकर्षित किया है। परियोजना के प्रमुख Anastasios Angelopoulos ने यहां तक कि मजाक में कहा कि उनकी प्रेमिका हर दिन Chatbot Arena के विषय पर बात सुनकर थक गई है।

इन तकनीकी कंपनियों के लिए, Chatbot Arena एक वास्तविक समय का "रैंकिंग" और "परीक्षण पत्थर" की तरह है। Meta AI उत्पाद प्रबंधन के निदेशक Joseph Spisak ने स्वीकार किया कि हर कंपनी शीर्ष पर पहुंचने के लिए प्रयासरत है, क्योंकि AI इस निर्णायक तकनीकी क्षेत्र में, कोई भी मामूली बढ़त बड़ी बाजार और प्रतिभा आकर्षण ला सकती है।

हाल ही में, Google का Gemini मॉडल प्लेटफार्म पर "आप मुझे पकड़ें, मैं आपको पकड़ूं" का एक शानदार प्रदर्शन कर रहा है। दूसरे स्थान से पहले स्थान पर पहुंचकर, शैली नियंत्रण, कोडिंग क्षमताओं आदि के कई आयामों में पूरी तरह से突破 कर चुका है, और OpenAI के साथ मुकाबले में भी पीछे नहीं रहा। यह वास्तविक समय और पारदर्शी मुकाबला तरीका AI की प्रगति को जीवंत और रोचक बनाता है।

दिलचस्प बात यह है कि, हालांकि कुछ शोधकर्ताओं ने Chatbot Arena की परीक्षण विधि को "सुभाविक अनुभव पर आधारित मूल्यांकन" कहा है, लेकिन यह उपयोगकर्ता अनुभव के करीब होने के कारण, AI मॉडल के वास्तविक प्रदर्शन को अधिकतम रूप से पुन: प्रस्तुत करता है। प्लेटफार्म के प्रमुख हमेशा खुले दृष्टिकोण बनाए रखते हैं, उपयोगकर्ताओं को विभिन्न सुभाविक कारकों को छानने की अनुमति देते हैं, और अधिक वस्तुनिष्ठ मूल्यांकन की खोज करते हैं।

वर्तमान में, यह गैर-लाभकारी परियोजना "AI क्षेत्र की विकिपीडिया" बनाने के लिए काम कर रही है। वे हर महीने परीक्षण प्रश्नों को अपडेट करते हैं, नियमित रूप से 20% उपयोगकर्ता फीडबैक डेटा को सार्वजनिक करते हैं, AI तकनीक की पारदर्शिता और प्रगति में योगदान देते हैं।

आज के तेजी से विकसित होते तकनीकी युग में, Chatbot Arena ने एक लगभग साइबरपंक तरीके से तकनीकी प्रतिस्पर्धा की सीमाओं को फिर से परिभाषित किया है। यह केवल एक रैंकिंग प्लेटफार्म नहीं है, बल्कि एक दर्पण है, जो कृत्रिम बुद्धिमत्ता के विकास की सबसे आगे की झलक दिखाता है।