हाल ही में, न्यू यॉर्क टाइम्स (The New York Times) और डेली न्यूज़ (Daily News) ने OpenAI के खिलाफ संयुक्त रूप से मुकदमा दायर किया है, जिसमें आरोप लगाया गया है कि उसने उनकी रचनाओं का बिना अनुमति उपयोग करके कृत्रिम बुद्धिमत्ता मॉडल को प्रशिक्षित किया।

इस मामले的发展 ने公众 का ध्यान आकर्षित किया है, क्योंकि याचिकाकर्ता की वकील टीम ने हाल के कोर्ट दस्तावेजों में उल्लेख किया है कि OpenAI के इंजीनियरों ने संबंधित डेटा को संभालते समय उन सबूतों को अनजाने में हटा दिया जो मामले पर महत्वपूर्ण प्रभाव डाल सकते थे।

कॉपीराइट

सूत्रों के अनुसार, OpenAI ने इस गिरावट में दो वर्चुअल मशीन प्रदान करने पर सहमति जताई थी, ताकि याचिकाकर्ता की वकील टीम यह जांच सके कि क्या इसके प्रशिक्षण डेटा में कॉपीराइट सामग्री शामिल है। वर्चुअल मशीन एक प्रकार की आभासी कंप्यूटर होती है जो कंप्यूटर ऑपरेटिंग सिस्टम के भीतर चलती है, और आमतौर पर परीक्षण, डेटा बैकअप और एप्लिकेशन चलाने के लिए उपयोग की जाती है। 1 नवंबर से, न्यू यॉर्क टाइम्स और डेली न्यूज़ के कानूनी सलाहकार और उनके द्वारा नियुक्त विशेषज्ञ OpenAI के प्रशिक्षण डेटा पर 150 घंटे से अधिक काम कर चुके हैं।

हालांकि, 14 नवंबर को, OpenAI के इंजीनियरों ने अनजाने में एक वर्चुअल मशीन पर संग्रहीत खोज डेटा को हटा दिया। याचिकाकर्ता के वकील के पत्र के अनुसार, यद्यपि OpenAI ने खोए हुए डेटा को पुनर्प्राप्त करने का प्रयास किया और अधिकांश मामलों में सफल भी रहा, लेकिन फ़ोल्डर संरचना और फ़ाइल नाम "अवापसी योग्य नहीं" होने के कारण पुनर्प्राप्त डेटा का उपयोग यह निर्धारित करने के लिए नहीं किया जा सका कि समाचार याचिकाकर्ता के लेख को OpenAI के मॉडल को प्रशिक्षित करने के लिए कैसे उपयोग किया गया।

याचिकाकर्ता के कानूनी सलाहकार ने यह指出 किया कि वे नहीं मानते कि यह हटाना जानबूझकर था, लेकिन यह घटना दर्शाती है कि OpenAI "अपने डेटा सेट में संभावित उल्लंघन सामग्री की खोज में सर्वोत्तम स्थिति में है।" इसका मतलब है कि OpenAI को अपनी स्वयं की उपकरणों का उपयोग करके संबंधित उल्लंघन सामग्री को अधिक प्रभावी ढंग से खोजने की आवश्यकता है।

OpenAI इस मामले और अन्य समान मामलों में हमेशा यह दावा करता रहा है कि सार्वजनिक रूप से उपलब्ध डेटा का उपयोग करके मॉडल प्रशिक्षण उचित उपयोग (fair use) है। इसका मतलब है कि OpenAI का मानना है कि उसे इन उदाहरणों के उपयोग के लिए कॉपीराइट शुल्क का भुगतान करने की आवश्यकता नहीं है, हालाँकि वह इन मॉडलों से लाभ प्राप्त करता है।

यह उल्लेखनीय है कि OpenAI ने बढ़ती संख्या में नए मीडिया के साथ लाइसेंसिंग समझौतों पर हस्ताक्षर किए हैं, जिसमें एपी, बिजनेस इनसाइडर, फाइनेंशियल टाइम्स आदि शामिल हैं, लेकिन इन समझौतों की विशिष्ट शर्तों को OpenAI ने सार्वजनिक नहीं किया है। सूत्रों के अनुसार, सामग्री सहयोगी Dotdash को प्रति वर्ष कम से कम 16 मिलियन डॉलर का मुआवजा मिलता है।

हालांकि कानूनी मुद्दों पर विवाद है, OpenAI ने यह पुष्टि या अस्वीकार नहीं किया है कि उसने बिना अनुमति के विशिष्ट कॉपीराइट कार्यों का उपयोग करके एआई प्रशिक्षण किया।

मुख्य बिंदु:

🌐 OpenAI पर कॉपीराइट मुकदमे में संभावित महत्वपूर्ण सबूत को गलती से हटाने का आरोप है।  

🕒 याचिकाकर्ता के वकील ने कहा कि डेटा को पुनर्प्राप्त करने में उन्होंने काफी समय और मानव संसाधन खर्च किए।  

💼 OpenAI का यह मानना है कि इसके प्रशिक्षण मॉडल में सार्वजनिक डेटा का उपयोग उचित उपयोग है।