ओपनएआई ने दो ओपन सोर्स वेट्स लैंग्वेज मॉडल - gpt-oss-120b और gpt-oss-20b लॉन्च किए, जो 2019 में GPT-2 के बाद ओपनएआई का पहला ओपन सोर्स क्षेत्र में वापसी है। यह कदम ओपनएआई की रणनीति के महत्वपूर्ण परिवर्तन को चिह्नित करता है, और वैश्विक AI डेवलपर्स के लिए एक शक्तिशाली अनुमान उपकरण प्रदान करता है, AI तकनीक के व्यापक प्रसार और नवाचार को गति प्रदान करता है।

image.png

ओपन वेट्स मॉडल, डेवलपर्स को अधिक स्वतंत्रता प्रदान करते हैं

ओपनएआई के आधिकारिक बयान के अनुसार, gpt-oss-120b और gpt-oss-20b Apache 2.0 लाइसेंस के साथ जारी किए गए हैं, जो डेवलपर्स को मुफ्त डाउनलोड, संशोधन और व्यावसायिक उद्देश्यों के लिए उपयोग करने की अनुमति देते हैं। ये दो मॉडल क्रमशः 117 बिलियन और 21 बिलियन पैरामीटर के मिश्रित एक्सपर्ट (MoE) आर्किटेक्चर हैं, जो क्रमशः 5.1 बिलियन और 3.6 बिलियन पैरामीटर के एक्टिवेशन के साथ, उच्च कार्यक्षमता और कम संसाधन खपत के बीच संतुलन बनाए रखते हैं।

image.png

  • gpt-oss-120b: एक एनवीडिया H100 GPU (80GB मेमोरी) पर चल सकता है, जो डेटा सेंटर या उच्च श्रेणी के व्यवसाय स्थितियों के लिए उपयुक्त है, जो ओपनएआई के संप्रदायिक मॉडल o4-mini के समान प्रदर्शन दर्ज करता है, विशेष रूप से प्रतियोगी प्रोग्रामिंग (Codeforces), सामान्य समस्या समाधान (MMLU, HLE) और स्वास्थ्य संबंधी प्रश्न (HealthBench) में उत्कृष्ट प्रदर्शन करता है।
  • gpt-oss-20b: केवल 16 जीबी मेमोरी के साथ किनारे के उपकरण पर चल सकता है, जो स्थानीय अनुमान और उपकरण स्तरीय अनुप्रयोगों के लिए उपयुक्त है, o3-mini के समान प्रदर्शन दर्ज करता है, विशेष रूप से प्रतियोगी गणित (AIME2024 & 2025) क्षेत्र में उत्कृष्ट प्रदर्शन करता है।

इन मॉडल लंबे 128k token के संदर्भ लंबाई के समर्थन के साथ अद्वितीय घनी और स्थानीय बैंड स्पर्श दर्शन तकनीक का उपयोग करते हैं और समूहित बहु-प्रश्न दृष्टि तकनीक के साथ अनुमान की दक्षता बढ़ाते हैं। ओपनएआई ने 'o200k_harmony' टोकनाइज़र भी ओपन सोर्स किया है, जो विकास के लिए बाधाओं को कम करता है।

सुरक्षा और जिम्मेदारी, ओपन सोर्स मानकों को फिर से परिभाषित करते हैं

ओपनएआई ने अपने जारी करने में बल दिया कि सुरक्षा gpt-oss श्रृंखला के केंद्र में है। ओपन सोर्स मॉडल के खराब अनुकूलन के जोखिम के लिए, ओपनएआई ने gpt-oss-120b के लिए विरोधी अनुकूलन परीक्षण किया और अपने "तैयारता ढांचा" (Preparedness Framework) के माध्यम से पुष्टि की, जो यह साबित करता है कि खराब अनुकूलन के बाद भी मॉडल जैविक, रासायनिक और नेटवर्क सुरक्षा क्षेत्र में उच्च जोखिम क्षमता तक नहीं पहुंचता। बाहरी सुरक्षा विशेषज्ञों की समीक्षा मॉडल के सुरक्षा मानकों में अतिरिक्त वृद्धि प्रदान करती है।

इसके अलावा, ओपनएआई डेवलपर्स से अनुरोध करता है कि वे मॉडल के उपयोग के समय अपनी आवश्यकताओं के अनुसार अतिरिक्त सुरक्षा उपाय करें, ताकि विविध अनुप्रयोग परिदृश्यों में संभावित जोखिमों का सामना कर सकें। मॉडल कार्ड और अध्ययन पत्र में सुरक्षा परीक्षण परिणामों की विस्तृत घोषणा की गई है, जो ओपन सोर्स समुदाय के लिए पारदर्शिता के लिए एक आधार प्रदान करती है।

image.png

image.png

रणनीतिक विपरीत, ओपन सोर्स प्रतिस्पर्धा और व्यवसाय की आवश्यकताओं के लिए

ओपनएआई के इस कदम को ओपन सोर्स क्षेत्र में प्रतिस्पर्धा के लिए रणनीतिक समायोजन माना जाता है। हाल के वर्षों में, मेटा, डीप सीक आदि कंपनियां मॉडल खोलकर बाजार पर कब्जा कर रही हैं, जिसके कारण ओपनएआई को अपने बंद सोर्स नीति की जांच करने के लिए मजबूर किया गया। ओपनएआई के सीईओ सैम अल्टमैन ने Reddit AMA में कहा था कि कंपनी की पिछली ओपन सोर्स रास्ता "गलत दिशा में गई थी", इस जारीकरण के माध्यम से वे अपने ओपन सोर्स वादे के पालन के पहले चरण के रूप में आगे बढ़ रहे हैं।

एक ही समय में, gpt-oss श्रृंखला व्यवसाय के स्थानीय डेप्लॉयमेंट और डेटा गोपनीयता की आवश्यकताओं की पूर्ति करती है। वित्त, चिकित्सा, कानून आदि ऊंचे नियमन वाले क्षेत्रों में, मॉडल को निजी सर्वर पर डेप्लॉय किया जा सकता है, जिससे डेटा लीक के जोखिम को रोका जा सकता है। ओपनएआई ने स्वीडन राष्ट्रीय कृत्रिम बुद्धिमत्ता केंद्र AI Sweden जैसे संगठनों के साथ सहयोग किया है, जो मॉडल के विशिष्ट भाषा और सांस्कृतिक पृष्ठभूमि में प्रदर्शन को सुधारने के लिए क्षेत्रीय अनुकूलन की खोज कर रहे हैं।

डेवलपर्स पावर, AI के नए संभावनाएं खोलते हैं

gpt-oss श्रृंखला कई विकास फ्रेमवर्क के समर्थन के साथ आती है, जैसे Transformers, vLLM, Ollama और llama.cpp, डेवलपर्स हंगिंग फेस, GitHub आदि माध्यम से मॉडल वेट्स के डाउनलोड कर सकते हैं और ओपनएआई द्वारा प्रदान किए गए संदर्भ कोड के साथ तेजी से शुरू कर सकते हैं। मॉडल में चेन-ऑफ-थॉट (Chain-of-Thought), टूल कॉल (पायथन कोड निष्पादन, वेब सर्च आदि के समर्थन के साथ) और संरचित आउटपुट (JSON, YAML आदि) शामिल हैं, जो बुद्धिमान एजेंट वर्कफ्लो के निर्माण के लिए विशेष रूप से उपयुक्त है।