Conjunto de Dados HelpSteer de Código Aberto

A equipe NVIDIA NeMo lançou o conjunto de dados de código aberto HelpSteer, em colaboração com a Scale AI, para melhorar a precisão e a coerência das respostas de modelos de linguagem. O conjunto de dados inclui 10.000 prompts de alta qualidade, utilizando a tecnologia NeMo SteerLM para tornar as respostas dos grandes modelos de linguagem mais controláveis.

Usando o conjunto de dados e a tecnologia, a NVIDIA treinou um modelo base Llama270B, que superou o desempenho do Llama2-70B. Essa ferramenta de código aberto oferece aos desenvolvedores flexibilidade e controle para construir LLMs personalizados, facilitando a compreensão e o uso da tecnologia SteerLM no framework NVIDIA NeMo.