Skywork-Reward-Llama-3.1-8B
Modèle de récompense avancé pour la classification de texte et le jugement de préférence
Produit OrdinaireProgrammationMachine LearningTraitement du Langage Naturel
Skywork-Reward-Llama-3.1-8B est un modèle de récompense avancé basé sur l'architecture Meta-Llama-3.1-8B-Instruct. Entraîné avec Skywork Reward Data Collection, un ensemble de données contenant 80 000 paires de préférences de haute qualité, il excelle dans le traitement de préférences complexes, y compris des paires de préférences difficiles, dans des domaines tels que les mathématiques, la programmation et la sécurité. En septembre 2024, il occupait la troisième place du classement RewardBench.
Skywork-Reward-Llama-3.1-8B Dernière situation du trafic
Nombre total de visites mensuelles
25296546
Taux de rebond
43.31%
Nombre moyen de pages par visite
5.8
Durée moyenne de la visite
00:04:45