Das NVIDIA NeMo-Team hat in Zusammenarbeit mit Scale AI den Open-Source-Datensatz HelpSteer veröffentlicht, um die Faktizität und Kohärenz von Antworten von Sprachmodellen zu verbessern. Der Datensatz enthält 10.000 hochwertige Prompts, die mithilfe der NeMo SteerLM-Technologie die Steuerung der Antworten großer Sprachmodelle ermöglichen.
Durch die Anwendung des Datensatzes und der Technologie hat NVIDIA ein verbessertes Basismodell, Llama270B, trainiert, das Llama2-70B in seiner Leistung übertrifft.
Dieses Open-Source-Tool bietet Entwicklern die Flexibilität und Kontrolle, um eigene LLMs zu erstellen und das Verständnis und die Anwendung der SteerLM-Technologie im NVIDIA NeMo-Framework zu verbessern.