नेमोट्रॉन-4-340B-रिवॉर्ड NVIDIA द्वारा विकसित एक बहुआयामी पुरस्कार मॉडल है, जो सिंथेटिक डेटा जनरेशन पाइपलाइन के लिए उपयोग किया जाता है, जो शोधकर्ताओं और डेवलपर्स को अपने स्वयं के बड़े भाषा मॉडल (LLMs) बनाने में मदद करता है। यह मॉडल नेमोट्रॉन-4-340B-बेस मॉडल और एक रैखिक परत से बना है, जो प्रतिक्रिया के अंत में टोकन को पाँच स्केलर मानों में बदल सकता है, जो HelpSteer2 गुणों से मेल खाते हैं। यह अधिकतम 4096 टोकन की संदर्भ लंबाई का समर्थन करता है और प्रत्येक सहायक दौर के पाँच गुणों का मूल्यांकन करने में सक्षम है।