Llama3-70B-SteerLM-RM
70 अरब पैरामीटर वाला बहुआयामी पुरस्कार मॉडल
सामान्य उत्पादप्रोग्रामिंगभाषा मॉडलपुरस्कार मॉडल
Llama3-70B-SteerLM-RM एक 70 अरब पैरामीटर वाला भाषा मॉडल है, जिसे विशेषता पूर्वानुमान मॉडल के रूप में उपयोग किया जाता है, एक बहुआयामी पुरस्कार मॉडल जो पारंपरिक पुरस्कार मॉडल में एकल स्कोर के बजाय कई पहलुओं में मॉडल प्रतिक्रियाओं का मूल्यांकन करता है। यह मॉडल HelpSteer2 डेटासेट पर प्रशिक्षित किया गया है और NVIDIA NeMo-Aligner का उपयोग करके प्रशिक्षित किया गया है, जो एक स्केलेबल टूलकिट है जो कुशल और प्रभावी मॉडल संरेखण के लिए है।
Llama3-70B-SteerLM-RM नवीनतम ट्रैफ़िक स्थिति
मासिक कुल विज़िट
23904807
बाउंस दर
43.33%
प्रति विज़िट औसत पृष्ठ
5.8
औसत विज़िट अवधि
00:04:51