हाल ही में एंट्स बैलिंग मॉडल टीम ने अपने नए उच्च प्रदर्शन वाले सोच मॉडल - रिंग-फ्लैश-2.0 के खुला स्रोत घोषणा की। यह मॉडल लिंग-फ्लैश-2.0-बेस पर गहरा अनुकूलन करके बनाया गया है, जो कि कृत्रिम बुद्धिमत्ता के क्षेत्र में एक महत्वपूर्ण उपलब्धि है। रिंग-फ्लैश-2.0 के कुल 10 बिलियन पैरामीटर हैं, लेकिन प्रत्येक अनुमान में, केवल 61 करोड़ को सक्रिय किया जाता है, इस प्रभावी सक्रियण तंत्र ने मॉडल को शक्तिशाली गणना क्षमता प्रदान की है, साथ ही बड़े संसाधनों की बचत भी की है।

टीम के परिचय के अनुसार, रिंग-फ्लैश-2.0 विभिन्न कठिन बेंचमार्क परीक्षणों में अच्छा प्रदर्शन करता है, जैसे कि गणित प्रतियोगिता, कोड जनरेशन और तार्किक तर्क। इसकी क्षमता इसके समान आकार के 4 बिलियन पैरामीटर मॉडल से भी अधिक है, और यह बड़े पैमाने पर खुले स्रोत दुर्लभ मॉडल (MoE) और कुछ बंद स्रोत उच्च प्रदर्शन वाले सोच मॉडल API के साथ तुलनीय है, जो इसकी अद्वितीय प्रतिस्पर्धा क्षमता को दर्शाता है।

image.png

रिंग-फ्लैश-2.0 की मॉडल क्षमता को पूरी तरह से सुधारने के लिए, एंट्स बैलिंग टीम ने एक नवीनतम दो चरणों के सुधार के लिए अनुकूलित शिक्षा (RL) प्रक्रिया डिज़ाइन की। पहले, लॉन्ग-कॉट (लंबे अनुक्रम चेन थिंकिंग) SFT (संवेदनशील सुधार) के माध्यम से हल्का, लंबे अनुक्रम चेन थिंकिंग SFT के माध्यम से, लिंग-फ्लैश-2.0-बेस मॉडल को विभिन्न सोच के तरीकों को सीखने में सक्षम बनाया गया। फिर, RLVR (पुनर्बलन वैध्यता पुरस्कार) शिक्षा के माध्यम से वैध्यता वाले पुरस्कार का उपयोग करके, मॉडल के तार्किक विचार क्षमता को लगातार उत्तेजित किया गया। अंत में, RLHF (पुनर्बलन मानव प्रतिक्रिया) चरण जोड़ा गया, जिससे मॉडल की सामान्य क्षमता में वृद्धि हुई।

image.png

महत्वपूर्ण बात यह है कि रिंग-फ्लैश-2.0 के मॉडल भार, पुनर्बलन शिक्षा योजना और डेटा रेसिपी पूरी तरह से खुले स्रोत होंगे, जो विकासक और अनुसंधानकर्ताओं के लिए मूल्यवान संसाधन प्रदान करते हैं। रुचि रखने वाले उपयोगकर्ता Hugging Face और ModelScope पर संबंधित सामग्री प्राप्त कर सकते हैं और इस शक्तिशाली मॉडल की खोज शुरू कर सकते हैं।

image.png

आर्टिफिशियल इंटेलिजेंस प्रौद्योगिकी के लगातार विकास के साथ, रिंग-फ्लैश-2.0 निश्चित रूप से भविष्य के बुद्धिमान अनुप्रयोगों के लिए नए संभावनाएं खोल देता है, उम्मीद है कि यह विभिन्न क्षेत्रों में व्यापक उपयोग और आगे के अप्रत्याशित अंक लाएगा!

मॉडल के पता:

https://huggingface.co/inclusionAI/Ring-flash-2.0

https://modelscope.cn/models/inclusionAI/Ring-flash-2.0