हाल ही में, सिलिकॉन बेस्ड फ्लो मॉडल सेवा प्लेटफॉर्म ने मंगो ग्रुप के बेज़िल टीम द्वारा अपनाई गई नवीनतम ओपन सोर्स Ling-flash-2.0 को आधिकारिक रूप से लॉन्च कर दिया है। यह प्लेटफॉर्म पर 130वां मॉडल है।

Ling-flash-2.0 एक MoE आर्किटेक्चर पर आधारित एक बड़ा भाषा मॉडल है, जिसमें 10 बिलियन पैरामीटर हैं और एक्टिवेशन के समय केवल 610 मिलियन पैरामीटर का उपयोग किया जाता है (अस्पष्ट एक्टिवेशन 480 मिलियन)। 20TB से अधिक उच्च गुणवत्ता वाले डेटा के साथ पूर्व-प्रशिक्षण, संवेदनशील अनुकूलन और बहु-चरणीय मजबूती सीखने के बाद, इस मॉडल ने 6 बिलियन पैरामीटर के साथ एक बेहतरीन प्रदर्शन दिखाया है, जो 40 बिलियन पैरामीटर के Dense मॉडल के समान है।

image.png

Ling-flash-2.0 जटिल तर्क, कोड जनरेशन और फ्रंट-एंड विकास के क्षेत्रों में उत्कृष्ट प्रदर्शन दिखाता है, जो उपयोगकर्ताओं को अधिक शक्तिशाली पाठ प्रसंस्करण क्षमता प्रदान करता है। इसकी कीमत तुलनात्मक रूप से सस्ती है, प्रति मिलियन टोकन प्रविष्टि के लिए 1 रुपया है और निर्गम के लिए प्रति मिलियन टोकन 4 रुपया है। साथ ही, घरेलू और अंतरराष्ट्रीय साइट के नए उपयोगकर्ता क्रमशः 14 रुपये या 1 अमेरिकी डॉलर के उपयोग अनुभव उपहार प्राप्त कर सकते हैं।

Ling-flash-2.0 के प्रदर्शन में निश्चित लाभ है। 40 बिलियन पैरामीटर के नीचे के Dense मॉडल (जैसे Qwen3-32B-Non-Thinking और Seed-OSS-36B-Instruct) और अधिक एक्टिवेशन पैरामीटर वाले MoE मॉडल (जैसे Hunyuan-A13B-Instruct और GPT-OSS-120B/low) की तुलना में, Ling-flash-2.0 जटिल तर्क क्षमता में अधिक शक्तिशाली है। विशेष रूप से रचनात्मक कार्यों में, यह मॉडल भी बहुत प्रतिस्पर्धी है।

इसके अलावा, Ling-flash-2.0 की आर्किटेक्चर को ध्यान से डिजाइन किया गया है, जो तेज़ तर्क प्रदान कर सकता है। Ling Scaling Laws के निर्देशों के अनुसार, Ling2.0 ने 1/32 एक्टिवेशन अनुपात के साथ MoE आर्किटेक्चर का उपयोग किया है और कई विवरणों में सुधार किया है, जिससे छोटे एक्टिवेशन वाले MoE मॉडल को Dense आर्किटेक्चर के प्रदर्शन लाभ प्राप्त होता है। H20 के माध्यम से डेप्लॉय करते समय, Ling-flash-2.0 की आउटपुट गति प्रति सेकंड 200+ टोकन तक हो सकती है, जो 36B के Dense मॉडल की तुलना में 3 गुना से अधिक गति है।

सिलिकॉन फ्लो प्लेटफॉर्म विकासकर्ताओं को तेज, आर्थिक और विश्वसनीय बड़े मॉडल API सेवाएं प्रदान करने के लिए लक्षित है। Ling-flash-2.0 के अलावा, प्लेटफॉर्म पर विभिन्न भाषाओं, छवियों, ध्वनि, वीडियो आदि के मॉडल भी एकत्रित हैं, जो विकासकर्ताओं की विभिन्न आवश्यकताओं को पूरा करते हैं। विकासकर्ता प्लेटफॉर्म पर विभिन्न मॉडल की तुलना और संयोजन कर सकते हैं, उच्च दक्षता वाले API के सरल उपयोग के माध्यम से जनरेटिव AI एप्लिकेशन के लिए सबसे अच्छी प्रथा को बढ़ावा दे सकते हैं।

घरेलू साइट पर ऑनलाइन परीक्षण

https://cloud.siliconflow.cn/models

अंतरराष्ट्रीय साइट पर ऑनलाइन परीक्षण

https://cloud.siliconflow.com/models

मुख्य बातें:

🌟 Ling-flash-2.0 MoE आर्किटेक्चर पर आधारित 10 बिलियन पैरामीटर भाषा मॉडल है, जिसमें जटिल तर्क क्षमता है।

⚡ मॉडल अधिकतम 128K के संदर्भ लंबाई का समर्थन करता है, जो तेज तर्क अनुभव प्रदान करता है, आउटपुट गति प्रति सेकंड 200+ टोकन तक हो सकती है।

💰 घरेलू और अंतरराष्ट्रीय साइट पर नए उपयोगकर्ता उपयोग अनुभव उपहार प्राप्त कर सकते हैं, सिलिकॉन फ्लो प्लेटफॉर्म विकासकर्ताओं के नवाचार में मदद करने के लिए विभिन्न बड़े मॉडल सेवाएं प्रदान करता है।