Nemotron-Mini-4B-Instruct es un modelo de lenguaje pequeño desarrollado por NVIDIA, optimizado para velocidad y facilidad de despliegue en dispositivos mediante destilación, poda y cuantificación. Es una versión ajustada de nvidia/Minitron-4B-Base, obtenida mediante la poda y destilación del modelo Nemotron-4 15B usando las técnicas de compresión de modelos de lenguaje grande de NVIDIA. Este modelo de instrucciones está optimizado para juegos de rol, preguntas y respuestas mejoradas por recuperación (RAG QA) y llamadas a funciones, admite una longitud de contexto de 4096 tokens y está listo para uso comercial.