एनवीडिया ने सामान्य बड़े मॉडल Nemotron-4 जारी किया, जिसमें 150 बिलियन पैरामीटर हैं, जो बहुभाषी और कोडिंग कार्यों में उत्कृष्ट प्रदर्शन करता है। मॉडल ने Chinchilla मॉडल के स्केलिंग कानून को अपनाया, जो कंप्यूटेशनल बजट, डेटा और मॉडल के आकार को अनुकूलित करता है, समान पैरामीटर आकार के मॉडल को पार करता है, और सबसे मजबूत सामान्य भाषा मॉडल बन गया है। Nemotron-4 का लक्ष्य एकल A100 या H100 GPU पर चलना है, जो बड़े मॉडल क्षेत्र के लिए नए मानक स्थापित करता है।
एनवीडिया ने Nemotron-4 का विमोचन किया: 150 बिलियन पैरामीटर सामान्य बड़े मॉडल, लक्ष्य एकल A100/H100 पर चलाना

站长之家
यह लेख AIbase दैनिक से है
【AI दैनिक】 कॉलम में आपका स्वागत है! यहाँ आर्टिफ़िशियल इंटेलिजेंस की दुनिया का पता लगाने के लिए आपकी दैनिक मार्गदर्शिका है। हर दिन हम आपके लिए AI क्षेत्र की हॉट कंटेंट पेश करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, तकनीकी रुझानों को समझने में आपकी मदद करते हैं और अभिनव AI उत्पाद अनुप्रयोगों को समझते हैं।