Light-R1-14B-DS बीजिंग क्यूहू टेक्नोलॉजी कंपनी लिमिटेड द्वारा विकसित एक ओपन-सोर्स गणितीय मॉडल है। यह मॉडल DeepSeek-R1-Distill-Qwen-14B पर आधारित है और सुदृढीकरण शिक्षण द्वारा प्रशिक्षित किया गया है, AIME24 और AIME25 गणित प्रतियोगिता बेंचमार्क परीक्षणों में क्रमशः 74.0 और 60.2 के उच्च स्कोर प्राप्त किए हैं, जो कई 32B पैरामीटर मॉडलों से आगे निकल गया है। इसने कम बजट में पहले से ही लंबी श्रृंखला अनुमान माइक्रोट्यूनिंग मॉडल के सुदृढीकरण शिक्षण के प्रयास को सफलतापूर्वक लागू किया है, ओपन-सोर्स समुदाय के लिए एक शक्तिशाली गणितीय मॉडल उपकरण प्रदान करता है। इस मॉडल का ओपन-सोर्स होना शिक्षा क्षेत्र में प्राकृतिक भाषा प्रसंस्करण को बढ़ावा देने में मदद करता है, खासकर गणितीय समस्या समाधान के क्षेत्र में, शोधकर्ताओं और डेवलपर्स के लिए एक मूल्यवान अनुसंधान आधार और व्यावहारिक उपकरण प्रदान करता है।