हाल ही में, एक सर्वेक्षण ने खुलासा किया कि कई टेक दिग्गजों, जिनमें एप्पल भी शामिल है, ने AI मॉडल को प्रशिक्षित करने के लिए YouTube वीडियो सबटाइटल का उपयोग किया। ये डेटा 170,000 से अधिक वीडियो को कवर करता है, जिसमें प्रसिद्ध निर्माताओं जैसे MKBHD और Mr. Beast का कंटेंट शामिल है। एप्पल ने इन डेटा का उपयोग अपने ओपन-सोर्स मॉडल OpenELM को प्रशिक्षित करने के लिए किया, जिसे इस साल अप्रैल में जारी किया गया था।

एप्पल, iOS 18, Apple Intelligence

इस पर, एप्पल ने हाल ही में स्पष्ट किया कि OpenELM का उपयोग उसके किसी भी AI या मशीन लर्निंग कार्यक्षमता में नहीं किया गया है, जिसमें Apple Intelligence भी शामिल है। एप्पल ने जोर देकर कहा कि OpenELM को विकसित करने का उद्देश्य अनुसंधान समुदाय में योगदान करना और ओपन-सोर्स बड़े भाषा मॉडल की प्रगति को बढ़ावा देना है। इससे पहले, एप्पल के शोधकर्ताओं ने OpenELM को "सबसे उन्नत ओपन भाषा मॉडल" के रूप में वर्णित किया था।

एप्पल ने कहा कि OpenELM केवल अनुसंधान उद्देश्यों के लिए उपयोग किया जाता है, और यह किसी भी Apple Intelligence कार्यक्षमता का समर्थन नहीं करता है। यह मॉडल ओपन-सोर्स के रूप में जारी किया गया है, जिसे एप्पल के मशीन लर्निंग अनुसंधान वेबसाइट पर प्राप्त किया जा सकता है। इसका मतलब है कि "YouTube सबटाइटल" डेटा सेट का उपयोग Apple Intelligence का समर्थन करने के लिए नहीं किया गया है। एप्पल ने पहले कहा था कि Apple Intelligence मॉडल "अधिकार प्राप्त डेटा पर प्रशिक्षित किया गया है, जिसमें विशिष्ट कार्यों के लिए चुने गए डेटा और वेब क्रॉलर्स द्वारा एकत्र किए गए सार्वजनिक डेटा शामिल हैं।"

यह ध्यान देने योग्य है कि एप्पल वर्तमान में OpenELM का नया संस्करण विकसित करने की योजना नहीं बना रहा है। "कनेक्शन" पत्रिका ने रिपोर्ट किया है कि एप्पल के अलावा, Anthropic और NVIDIA जैसी कंपनियों ने भी अपने AI मॉडल को प्रशिक्षित करने के लिए इस "YouTube सबटाइटल" डेटा सेट का उपयोग किया है। यह डेटा सेट गैर-लाभकारी संगठन EleutherAI के बड़े डेटा सेट "The Pile" का एक हिस्सा है।

इस घटना ने AI प्रशिक्षण डेटा के स्रोत और इसके गोपनीयता और कॉपीराइट पर प्रभाव के बारे में चर्चा को जन्म दिया है। हालांकि एप्पल ने OpenELM के उपयोग को स्पष्ट किया है, लेकिन तकनीकी कंपनियों द्वारा सार्वजनिक डेटा का उपयोग करके AI मॉडल को प्रशिक्षित करने की प्रथा पर ध्यान देना अभी भी महत्वपूर्ण है।