HelpSteer2 é um conjunto de dados de código aberto lançado pela NVIDIA, projetado para auxiliar no treinamento de modelos alinhados para serem mais úteis, factuais e coerentes, com ajuste na complexidade e redundância das respostas. Criado em colaboração com a Scale AI, atingiu 88,8% no RewardBench quando usado com o modelo base Llama 3 70B, sendo um dos melhores modelos de recompensa até 12 de junho de 2024.