ExllamaV2 एक ऐसा इनफेरेंस लाइब्रेरी है जो सामान्य उपभोक्ता स्तर के GPU पर बड़े पैमाने पर भाषा मॉडल को प्रभावी ढंग से चलाने के लिए है। यह नए समायोज्य क्वांटाइज़ेशन प्रारूप EXL2 का समर्थन करता है, जो 1.5-2 गुना प्रदर्शन में सुधार करता है। इस परियोजना का लक्ष्य एक ऐसा LLM इनफेरेंस समाधान बनना है जो उपयोग में आसान हो, HuggingFace मॉडल के साथ संगत हो, इंटरैक्टिव उदाहरण प्रदान करे, और LLM द्वारा लाए गए शक्तिशाली क्षमताओं का बाधा-मुक्त अनुभव प्रदान करे। कुल मिलाकर, ExllamaV2 घरेलू GPU संसाधनों का उपयोग करके बड़े पैमाने पर भाषा मॉडल चलाने के लिए एक व्यावहारिक रास्ता प्रदान करता है।
ExllamaV2: एक लोकल LLM के लिए आधुनिक उपभोक्ता GPU पर इन्फ्रेंस लाइब्रेरी

站长之家
यह लेख AIbase दैनिक से है
【AI दैनिक】 कॉलम में आपका स्वागत है! यहाँ आर्टिफ़िशियल इंटेलिजेंस की दुनिया का पता लगाने के लिए आपकी दैनिक मार्गदर्शिका है। हर दिन हम आपके लिए AI क्षेत्र की हॉट कंटेंट पेश करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, तकनीकी रुझानों को समझने में आपकी मदद करते हैं और अभिनव AI उत्पाद अनुप्रयोगों को समझते हैं।