Nemotron-Mini-4B-Instruct ist ein kleines Sprachmodell von NVIDIA, das durch Destillation, Pruning und Quantisierung optimiert wurde, um Geschwindigkeit und einfache Gerätebereitstellung zu gewährleisten. Es ist eine feinabgestimmte Version von nvidia/Minitron-4B-Base, abgeleitet von Nemotron-4 15B durch Pruning und Destillation mithilfe der NVIDIA Large Language Model Compression-Technologie. Dieses instruktionsbasierte Modell ist optimiert für Rollenspiele, Retrieval-Augmented Question Answering (RAG QA) und Funktionsaufrufe, unterstützt eine Kontextlänge von 4096 Tokens und ist für kommerzielle Zwecke bereit.