हाल के दिनों में, कृत्रिम बुद्धिमत्ता कंपनी Anthropic के अद्वितीय पुस्तक डिजिटलीकरण के तरीके के कारण सार्वजनिक ध्यान आकर्षित कर रही है। अंतरराष्ट्रीय मीडिया Ars Technica के अनुसार, Anthropic ने अपने AI सहायक Claude के प्रशिक्षण के लिए लाखों डॉलर के साथ बड़ी संख्या में भौतिक पुस्तकें खरीदीं और उन्हें डिजिटल फाइल में बदलने के लिए उन्हें अलग-अलग करके स्कैन कर दिया। इस प्रक्रिया के बाद, मूल पुस्तकें सीधे फेंक दी गईं।

Claude2, Anthropic, कृत्रिम बुद्धिमत्ता, चैटबॉट क्लॉड

अदालत के दस्तावेजों में खुलासा हुआ है कि Anthropic ने फरवरी 2024 में Tom Turvey को काम पर रखा, जिन्होंने Google Books परियोजना में संलग्न रहे हैं, जो "दुनिया की पुस्तकों को प्राप्त करने" के लिए जिम्मेदार रहे हैं। यह कदम निश्चित रूप से गूगल के पुस्तक डिजिटलीकरण प्रक्रिया में अदालत द्वारा अनुमोदित उपयोग के पैटर्न के समान बनाने के इच्छा को दर्शाता है।

अदालत के जज William Alsup ने फैसला दिया कि Anthropic के स्कैनिंग तरीका विवेकपूर्ण उपयोग के रूप में माना गया क्योंकि ये पुस्तकें कानूनी रूप से खरीदी गई थीं और स्कैन करने के बाद तुरंत नष्ट कर दी गईं, और डिजिटल फाइलें केवल आंतरिक उपयोग के लिए उपलब्ध रहीं, बाहर नहीं फैलाई गईं। उन्होंने इस बात की ओर ध्यान दिलाया कि ऐसा अनुवाद "जगह बचाने" के रूप में डिजिटल प्रक्रिया माना जा सकता है, जिसमें "उद्देश्यपूर्ण" विशेषता होती है। हालाँकि, शुरुआती चोरी के कार्यक्रम इसकी कानूनी गतिशीलता को कुछ हद तक प्रभावित कर गए।

AI प्रशिक्षण के लिए बड़ी मात्रा में गुणवत्तापूर्ण पाठ डेटा की आवश्यकता होती है, बड़े भाषा मॉडल बनाने के लिए बिलियन शब्दों को न्यूरल नेटवर्क में डाला जाता है, ताकि शब्दों और अवधारणाओं के बीच संबंध स्थापित किया जा सके। डेटा की गुणवत्ता मॉडल के आउटपुट की सटीकता को सीधे प्रभावित करती है, इसलिए कई AI कंपनियों को गुणवत्तापूर्ण प्रकाशित सामग्री की आवश्यकता होती है, जबकि आमतौर पर अनुमति बातचीत में समय बर्बाद करना पसंद नहीं करती है।

अमेरिका में "पहली बिक्री के सिद्धांत" के अंतर्गत, भौतिक पुस्तक के मालिक के बाद उसके साथ अपने ढंग से निपटा जा सकता है, जिससे पुस्तक खरीदना एक कानूनी "बाजू बदलने का तरीका" बन गया। हालांकि, Anthropic ने शुरू में पेशेवर अधिकारों के मुद्दे को छोड़ दिया, और कभी-कभी चोरी की ई-बुक का उपयोग किया। कानूनी विचार के बाद, कंपनी एक अधिक सुरक्षित विकल्प खोजने लगी, अंततः द्वितीय हस्त की पुस्तकें खरीदकर गुणवत्तापूर्ण प्रशिक्षण पाठ प्राप्त करने और अनुमति प्रक्रिया सरल करने का फैसला किया।

डिजिटलीकरण प्रक्रिया को तेज करने के लिए, Anthropic ने "निर्माण स्कैनिंग" के तरीके का उपयोग किया, जिसमें बड़ी संख्या में पुस्तकें खरीदी गईं, उन्हें खोलकर, काटकर और एक साथ मशीन पठनीय PDF फाइल में स्कैन कर दिया गया, जिसके लिए करोड़ों डॉलर की लागत आई। हालांकि, वर्तमान में अन-निर्माण स्कैनिंग तकनीक परिपक्व हो गई है, जैसे कि Internet Archive द्वारा विकसित की गई एक विधि जो मूल पुस्तक को बरकरार रखती है, लेकिन Anthropic के तरीके ने अभी भी व्यापक चर्चा उत्पन्न कर दी।

मुख्य बात:

📚 Anthropic ने भौतिक पुस्तकें खरीदकर उन्हें डिजिटल फाइल में बदलने के लिए करोड़ों डॉलर की लागत वहन की, जो AI सहायक Claude के प्रशिक्षण के लिए उपयोग की गई।  

⚖️ अदालत ने फैसला दिया कि उनके स्कैनिंग तरीका विवेकपूर्ण उपयोग के रूप में माना गया, क्योंकि पुस्तकें कानूनी रूप से खरीदी गईं और स्कैन करने के बाद नष्ट कर दी गईं।  

🔄 AI प्रशिक्षण के लिए बड़ी मात्रा में गुणवत्तापूर्ण पाठ डेटा की आवश्यकता होती है, Anthropic ने "निर्माण स्कैनिंग" के माध्यम से पुस्तक डिजिटलीकरण प्रक्रिया को तेज किया।