नेमोट्रॉन-मिनी-4B-इंस्ट्रक्ट NVIDIA द्वारा विकसित एक छोटा भाषा मॉडल है, जिसे गति में सुधार और ऑन-डिवाइस परिनियोजन की सुविधा के लिए आसवन, प्रूनिंग और मात्राकरण द्वारा अनुकूलित किया गया है। यह NVIDIA के बड़े भाषा मॉडल संपीड़न तकनीक प्रूनिंग और आसवन के माध्यम से नेमोट्रॉन-4 15B से प्राप्त nvidia/Minitron-4B-बेस का एक माइक्रो-ट्यून किया गया संस्करण है। यह निर्देश मॉडल भूमिका निभाने, पुनर्प्राप्ति-वर्धित प्रश्नोत्तर (RAG QA) और फ़ंक्शन कॉल के लिए अनुकूलित है, जो 4096 टोकन संदर्भ लंबाई का समर्थन करता है, और वाणिज्यिक उपयोग के लिए तैयार है।