O Nemotron-Mini-4B-Instruct é um modelo de linguagem pequeno desenvolvido pela NVIDIA, otimizado por destilação, poda e quantização para maior velocidade e facilidade de implantação em dispositivos. É uma versão refinada do nvidia/Minitron-4B-Base, derivada do Nemotron-4 15B por meio de técnicas de compressão de modelos de linguagem grandes da NVIDIA. Este modelo de instrução é otimizado para interpretação de papéis, perguntas e respostas aprimoradas por recuperação (RAG QA) e chamadas de função, suporta comprimento de contexto de 4096 tokens e está pronto para uso comercial.