हाल ही में, IBM ने चार नए Granite4.0Nano मॉडल पेश किए, जिनके पैरामीटर 35 लाख से 1.5 बिलियन तक हैं, जो कि कंपनी के कृत्रिम बुद्धिमत्ता के क्षेत्र में दक्षता और उपलब्धता पर ध्यान केंद्रित करते हैं। उद्योग में बड़े मॉडल आमतौर पर बादल के साथ निर्भर करते हैं, इसके विपरीत, Granite4.0Nano मॉडल सामान्य लैपटॉप पर चल सकते हैं यहां तक कि ब्राउज़र में स्थानीय रूप से भी चल सकते हैं। इससे डेवलपर्स को बादल सेवाओं पर निर्भर बिना उपभोक्ता हार्डवेयर या एज डिवाइस के लिए अनुप्रयोग बनाने में सक्षम हो जाता है।

सभी Granite4.0Nano मॉडल Apache2.0 लाइसेंस के तहत जारी किए गए हैं, जो अनुसंधानकर्ताओं, व्यवसायों और स्वतंत्र डेवलपर्स के लिए उपयुक्त हैं और व्यावसायिक उपयोग के लिए समर्थन करते हैं। ये मॉडल विभिन्न टूल्स, जैसे llama.cpp, vLLM और MLX के साथ अनुरूपता रखते हैं और ISO42001 ज़िम्मेदार AI विकास प्रमाण पत्र प्राप्त करते हैं।
Granite4.0Nano परिवार में चार मॉडल शामिल हैं: Granite-4.0-H-1B (लगभग 15 करोड़ पैरामीटर), Granite-4.0-H-350M (लगभग 35 लाख पैरामीटर), Granite-4.0-1B (लगभग 2 करोड़ पैरामीटर के एक प्रकार) और Granite-4.0-350M (एक प्रकार)। H श्रृंखला मॉडल मिश्रित स्टेट स्पेस आर्किटेक्चर का उपयोग करते हैं, जो कि कम लेटेंसी एज वातावरण के लिए उपयुक्त है, जबकि सामान्य ट्रैंसफॉर्मर मॉडल अधिक व्यापक अनुरूपता प्रदान करते हैं।
हालांकि बाजार में कई छोटे भाषा मॉडल हैं, लेकिन IBM के Nano परिवार अद्वितीय प्रदर्शन के कारण उभर कर आए हैं। नवीनतम बेंचमार्क टेस्ट दर्शाते हैं कि Granite4.0 मॉडल अपने समान दुश्मनों के लिए बेहतर प्रदर्शन करते हैं। IBM के अनुसंधान टीम ने कहा कि इन मॉडलों का निर्देश पालन और कार्य बुलाने के कार्यों में अच्छा प्रदर्शन हुआ है, और ये मॉडल स्मृति की आवश्यकता और गति में लाभ के साथ चल सकते हैं, जो गति के साथ मोबाइल उपकरणों या CPU पर चल सकते हैं।

उल्लेखनीय बात यह है कि IBM ने इन मॉडलों के साथ-साथ डेवलपर समुदाय के साथ बातचीत करने के लिए भी एक गतिविधि शुरू की, जिसमें फीडबैक एकत्र करके भविष्य के विकास की योजनाओं पर चर्चा की गई। Granite टीम रेडिट पर उपयोगकर्ताओं के साथ बातचीत करती है, जो कि कंपनी के खुले स्रोत AI विकास के लिए प्रयासों को दर्शाता है।
huggingface:https://huggingface.co/blog/ibm-granite/granite-4-nano
मुख्य बात:
🌟 IBM ने Granite4.0Nano मॉडल जारी किए, जो सामान्य हार्डवेयर पर चल सकते हैं, जिससे छोटे AI मॉडल की उपलब्धता में सुधार हुआ है।
🛠️ सभी मॉडल Apache2.0 लाइसेंस के तहत जारी किए गए हैं, जो अनुसंधान और व्यावसायिक उपयोग के लिए उपयुक्त हैं, जिससे खुलापन और अनुरूपता सुनिश्चित होती है।
📈 नवीनतम बेंचमार्क टेस्ट दर्शाते हैं कि Granite4.0 मॉडल अपने समान दुश्मनों के लिए बेहतर प्रदर्शन करते हैं, जो कि दक्ष प्रसंस्करण क्षमता दर्शाता है।




