Skywork-Reward-Gemma-2-27B
Modèle de récompense avancé basé sur l'architecture Gemma-2-27B
Produit OrdinaireProgrammationModèle de récompenseTraitement des préférences
Skywork-Reward-Gemma-2-27B est un modèle de récompense avancé basé sur l'architecture Gemma-2-27B, conçu pour gérer les préférences dans des scénarios complexes. Ce modèle a été entraîné sur 80 000 paires de préférences de haute qualité provenant de divers domaines tels que les mathématiques, la programmation et la sécurité. Skywork-Reward-Gemma-2-27B a occupé la première place du classement RewardBench en septembre 2024, démontrant ainsi ses capacités exceptionnelles en matière de traitement des préférences.
Skywork-Reward-Gemma-2-27B Dernière situation du trafic
Nombre total de visites mensuelles
25537072
Taux de rebond
44.24%
Nombre moyen de pages par visite
5.9
Durée moyenne de la visite
00:04:47