L'équipe NVIDIA NeMo a publié le jeu de données open source HelpSteer, en collaboration avec Scale AI, pour améliorer la factualité et la cohérence des réponses des modèles linguistiques. Ce jeu de données comprend 10 000 invites de haute qualité, permettant aux grands modèles linguistiques d'offrir des réponses plus contrôlables grâce à la technologie NeMo SteerLM.
En utilisant ce jeu de données et cette technologie, NVIDIA a entraîné le modèle de base Llama2-70B, surpassant en performances le modèle Llama2-70B. Cet outil open source offre aux développeurs la flexibilité et le contrôle nécessaires pour construire leurs propres LLM personnalisés, facilitant ainsi une meilleure compréhension et utilisation de la technologie SteerLM au sein du framework NVIDIA NeMo.