रेडिट ने सैन फ्रांसिस्को के उच्च न्यायालय में AI कंपनी एनथ्रोपिक के खिलाफ एक कारवाई दायर की है, जिसमें अनुमति के बिना रेडिट पोस्ट्स को क्लॉड भाषा मॉडल की प्रशिक्षण के लिए प्रणालीकृत ढंग से लिया गया है, जो यह तर्क देता है कि यह यूजर समझौते और व्यापारिक उपयोग के नियमों का उल्लंघन करता है।
इस कार्यक्रम ने AI प्रशिक्षण डेटा के प्राप्त करने के कानूनी विवादों को जोड़ा है, और विषय वाहक साइटों और AI कंपनियों के बीच बढ़ते तनाव को उजागर किया है। रेडिट ने अदालत से मांग की है कि एनथ्रोपिक को रेडिट कंटेंट से सभी AI मॉडल और डेटा सेट्स को हटाया जाए और उसे रेडिट डेटा से प्रशिक्षित AI मॉडल का व्यापारिक उपयोग करने से रोका जाए।
टेक्नोलॉजी की सुरक्षा मोहोगने जाती है
कार्यक्रम के अनुसार, एनथ्रोपिक ने रेडिट के यूजर समझौते के नियमों का अनदेखा कर दिया, जो robots.txt फ़ाइल और IP-आधारित दर सीमाओं जैसी टेक्नोलॉजी बचाव कार्यक्रमों को छोड़ दिया। और बहुत महत्वपूर्ण बात है, एनथ्रोपिक ने रेडिट के कंसेशन API (उपयोगकर्ता द्वारा पोस्ट हटाने पर अनुमति देने वाला उपकरण) को कभी नहीं जोड़ा।
रेडिट के अनुसार, एनथ्रोपिक ने खुले रूप से Reddit डेटा का उपयोग बताया है, और 40 से अधिक सबफ़ोरम्स (जैसे r/science, r/IAmA, और r/relationship_advice) को क्लॉड के लिए "उच्च गुणवत्ता" डेटा स्रोत के रूप में सूचीबद्ध किया। रेडिट का कहना है कि यह सार्थक डेटा एकमति के बिना एकत्रित किया गया है और यह संरक्षण के माध्यम से उल्लंघन करता है।
ठीक से प्रचार और वास्तविक व्यवहार में विरोधाभास
सबसे अधिक विवादास्पद है एनथ्रोपिक के सांविधानिक प्रतिनिधियों और वास्तविक व्यवहार के बीच का विरोधाभास। 2024 मई के बाद रेडिट को क्लॉडबॉट की ब्लैकलिस्ट में शामिल करने का कथन दिया गया। लेकिन रेडिट के आंतरिक लॉग दिखाते हैं कि इस कथन के बाद के महीनों में, एनथ्रोपिक रबोट ने रेडिट सर्वर पर 1 लाख से अधिक बार अवसर का उपयोग किया।
इस खोज ने एनथ्रोपिक के सार्वजनिक कथनों की जांच को चुनौती दी और यह रेडिट की कारवाई का मुख्य साक्ष्य बन गया।
उपयोगकर्ता गोपनीयता और व्यापारिक राज्य का दोहन
रेडिट ने कार्यक्रम में बताया कि एनथ्रोपिक के व्यवहार ने विशेषकर कंपनी के व्यापार राज्य को खतरा पैदा किया है और उपयोगकर्ता की गोपनीयता को भी खतरा बना दिया है। संज्ञाई या सही तरह से लाइसेंस के बिना या कंसेशन API के जोड़ने के बिना, यह निश्चित नहीं किया जा सकता है कि हटाए गए या संवेदनशील पोस्ट अभी भी क्लॉड मॉडल में शामिल हैं या नहीं।
"यदि एनथ्रोपिक जैसी तीसरी पक्षें रेडिट कंटेंट को अनुमति के बिना लेती हैं, तो रेडिट उपयोगकर्ताओं को उनकी कॉमन्स और गोपनीयता के नीतियों के किसी भी सुरक्षा का लाभ नहीं मिल पाएगा, इसका कारण उपयोगकर्ता जान नहीं पाएंगे कि कौन सी तीसरी पक्ष डेटा को पकड़े और लेंगी," कार्यक्रम में बताया गया है।
यह विचार वास्तविक डेटा के उपयोग के मुख्य क्षेत्र में पहुँच गया है: उपयोगकर्ताओं को उनके प्रकाशित कंटेंट के बाद का उपयोग करने का क्या अधिकार है, विशेषकर व्यापारिक AI प्रणालियों में?
तुलना: गूगल का संतुलित रास्ता
रेडिट ने अन्य AI कंपनियों के लिए एक अलग सहयोग रास्ता बताया। अनुमान है कि गूगल ने रेडिट से ट्रेनिंग डेटा के लिए प्रतिवर्ष $60 मिलियन का भुगतान किया है, और इस सहयोग ने अंतर्मुखी गूगल सर्च में रेडिट की व्यापकता में लेखांकन को बढ़ाया है।
यह तुलना ने AI उद्योग में डेटा प्राप्त करने के अंतर को बढ़ाया है: कुछ कंपनियां वैध अनुमति प्राप्त करने के लिए पैसे खर्च कर रही हैं, जबकि अन्य इसे टेक्नोलॉजी के माध्यम से बाहर से चुरा रही हैं।
वैधानिक मांग और उद्योग का प्रभाव
रेडिट की कारवाई में एनथ्रोपिक को अनुबंध तथा अवैध प्रतिस्पर्धा के लिए दोषी पाया जाएगा और प्रतिगमन लाभों की पेशकश की जाएगी। अधिक महत्वपूर्ण रूप से, रेडिट ने अदालत से मांग की है कि एनथ्रोपिक को क्लॉड या किसी भी रेडिट डेटा से प्रशिक्षित AI मॉडल का व्यापारिक उपयोग से रोक दिया जाए।
अगर रेडिट जीतता है, तो यह अन्य सामग्री प्लेटफामों के लिए AI कंपनियों के लिए समान कारवाई को एक उदाहरण बना सकता है और AI प्रशिक्षण डेटा के वैध प्राप्त करने की सीमाओं को पुनः परिभाषित कर सकता है। इस मुकदमे का परिणाम AI उद्योग के डेटा उपयोग प्रथाओं और लागत संरचनाओं पर निर्णायक प्रभाव डाल सकता है।
वर्तमान विवाद ने AI के तेजी से विकास और पारंपरिक कॉपीराइट और गोपनीयता के संरक्षण मैकेनिज़्म के बीच मौलिक विरोधाभास को प्रकट किया है। रेडिट के खिलाफ एनथ्रोपिक की कारवाई यह समस्या का संतुलन निर्धारित करने का महत्वपूर्ण प्रस्ताव हो सकता है।