2025-07-31 09:16:57.AIbase.20.1k
डीपसीक अगली पीढ़ी के तकनीक ने ACL2025 में सर्वश्रेष्ठ लेख पुरस्कार जीता, लंबे पाठ के प्रोसेसिंग कार्यक्षमता में 11 गुना वृद्धि हुई!
डीपसीक के डॉ. लियांग वेनफेंग टीम ने पेंग विश्वविद्यालय के साथ सहयोग करते हुए एक लेख जीता जो ACL2025 में सर्वश्रेष्ठ लेख पुरस्कार जीता। इस अध्ययन में मूल दुर्लभ ध्यान (NSA) योजना प्रस्तुत की गई है, जो एल्गोरिथ्म और हार्डवेयर के सह-अनुकूलन के माध्यम से संपीड़न, चयनकता और फिसलते तीन समानांतर ध्यान ब्रांच का उपयोग करती है, जो लंबे पाठ के प्रोसेसिंग की गति 11 गुना बढ़ाती है और पारंपरिक पूर्ण ध्यान मॉडल के आउटपुट के ऊपर जाती है। NSA 10 लाख tokens के संदर्भ लंबाई का समर्थन करती है, 64k पाठ प्रोसेसिंग में डीकोडिंग गति 11.6 गुना बढ़ जाती है, 27B पैरामीटर वाले मॉडल की बहुत सी मानक परीक्षणों में अच्छी तरह से प्रदर्शन हुआ है, जो लेख की ओर नेतृत्व करता है।