हाल ही में, कुंलुन वैनवेई ने अपने पूर्ण खुले स्रोत मॉडल Skywork-R1V3.0 का उद्घाटन किया, जिसका दावा है कि इसमें बहुमाध्यम तर्क के क्षेत्र में अभूतपूर्व स्तर तक पहुंच गई है, जो मानव प्रारंभिक विशेषज्ञों के स्तर के बराबर है। इस मॉडल के शिक्षण के दौरान सुदृढ़ शिक्षण रणनीति का उपयोग किया गया था, जिसके कारण इसके जटिल तार्किक मॉडलिंग और अंतर-विषय ज्ञान व्यापकता में महत्वपूर्ण प्रगति हुई।

Skywork-R1V3.0 को पिछले संस्करण Skywork-R1V2.0 के आधार पर "ठंडी शुरुआत" के साथ बनाया गया था, ऊंची गुणवत्ता वाले डिस्टिलेशन डेटा और अस्वीकृति नमूनाकरण तकनीक का उपयोग करके, एक शक्तिशाली बहुमाध्यम तर्क शिक्षण सेट का निर्माण सफलतापूर्वक किया गया। इस मॉडल के डिजाइन में लेखन के अलावा चित्र प्रसंस्करण भी शामिल है, जिसके कारण इसकी चित्र और पाठ के बीच तर्क क्षमता में महत्वपूर्ण सुधार हुआ।

image.png

बताया गया है कि Skywork-R1V3.0 के शिक्षण केवल लगभग 12,000 संवेदनशील सुधार नमूनों और 13,000 सुदृढ़ शिक्षण नमूनों पर निर्भर करता है, जो "छोटे डेटा से बड़ी क्षमता के उत्पादन" के अद्वितीय लाभ को दर्शाता है। विश्वसनीय सामान्य बहुमाध्यम मूल्यांकन MMMU में, Skywork-R1V3.0 को 76.0 अंक मिले, जो क्लॉड-3.7-सॉनेट (75.0 अंक) और GPT-4.5 (74.4 अंक) जैसे बंद स्रोत मॉडल को पार कर गया, जिसके द्वारा इसकी अद्वितीय बहुमाध्यम समझ क्षमता साबित हो गई।

विशिष्ट अनुप्रयोग परिस्थितियों में, Skywork-R1V3.0 भौतिकी, तार्किक और गणितीय तर्क के कई क्षेत्रों में उत्कृष्ट प्रदर्शन करता है। उदाहरण के लिए, भौतिकी तर्क मूल्यांकन में, इस मॉडल ने क्रमशः 52.8 अंक और 31.5 अंक के सबसे अच्छे खुले स्रोत परिणाम प्राप्त किए, जो जटिल भौतिक समस्याओं के बारे में इसकी समझ क्षमता को दर्शाता है। इसके अलावा, तार्किक तर्क परीक्षण में, Skywork-R1V3.0 ने 59.7 अंक का अच्छा परिणाम प्राप्त किया।

image.png

इस मॉडल के गणितीय तर्क में भी असाधारण क्षमता है, MathVista, MathVerse और MathVision जैसे मूल्यांकन में क्रमशः 77.1, 59.6 और 52.6 अंक हासिल किए, जो अन्य खुले स्रोत मॉडलों के मुकाबले बहुत अधिक है। इन उत्कृष्ट प्रदर्शनों के कारण, Skywork-R1V3.0 वर्तमान में खुले स्रोत बहुमाध्यम तर्क के क्षेत्र में एक शक्तिशाली प्रतिस्पर्धी बन गया है।

image.png

Skywork-R1V3.0 के उद्घाटन ने बहुमाध्यम तर्क प्रौद्योगिकी के एक नए शिखर को चिह्नित किया, इसकी मजबूत क्षमता और खुले स्रोत विशेषता AI प्रौद्योगिकी के आगे के विकास को बहुत अधिक बढ़ावा देगी।