Nemotron-Mini-4B-Instruct est un petit modèle linguistique développé par NVIDIA. Optimisé par distillation, élagage et quantification pour une vitesse accrue et un déploiement facile sur périphérique. Il s'agit d'une version fine-tunée de nvidia/Minitron-4B-Base, obtenue par élagage et distillation de Nemotron-4 15B grâce aux techniques de compression de modèles linguistiques de grande taille de NVIDIA. Ce modèle d'instructions est optimisé pour les jeux de rôle, les questions-réponses améliorées par recherche (RAG QA) et les appels de fonctions. Il prend en charge une longueur de contexte de 4096 jetons et est prêt à l'emploi commercial.