ExllamaV2: एक लोकल LLM के लिए आधुनिक उपभोक्ता GPU पर इन्फ्रेंस लाइब्रेरी

站长之家

द्वारा प्रकाशितAI समाचार · 2 मिनट पढ़ें · Sep 15, 2023

238

ExllamaV2 एक ऐसा इनफेरेंस लाइब्रेरी है जो सामान्य उपभोक्ता स्तर के GPU पर बड़े पैमाने पर भाषा मॉडल को प्रभावी ढंग से चलाने के लिए है। यह नए समायोज्य क्वांटाइज़ेशन प्रारूप EXL2 का समर्थन करता है, जो 1.5-2 गुना प्रदर्शन में सुधार करता है। इस परियोजना का लक्ष्य एक ऐसा LLM इनफेरेंस समाधान बनना है जो उपयोग में आसान हो, HuggingFace मॉडल के साथ संगत हो, इंटरैक्टिव उदाहरण प्रदान करे, और LLM द्वारा लाए गए शक्तिशाली क्षमताओं का बाधा-मुक्त अनुभव प्रदान करे। कुल मिलाकर, ExllamaV2 घरेलू GPU संसाधनों का उपयोग करके बड़े पैमाने पर भाषा मॉडल चलाने के लिए एक व्यावहारिक रास्ता प्रदान करता है।

exllamav2 GPU LLM

यह लेख AIbase दैनिक से है

【AI दैनिक】 कॉलम में आपका स्वागत है! यहाँ आर्टिफ़िशियल इंटेलिजेंस की दुनिया का पता लगाने के लिए आपकी दैनिक मार्गदर्शिका है। हर दिन हम आपके लिए AI क्षेत्र की हॉट कंटेंट पेश करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, तकनीकी रुझानों को समझने में आपकी मदद करते हैं और अभिनव AI उत्पाद अनुप्रयोगों को समझते हैं।

—— AIbase दैनिक समूह द्वारा बनाया गया

एंथ्रोपिक एशिया-प्रशांत में पहली बार टोक्यो में खोलेगा, एआई के नए अध्याय की शुरुआत करेगा

वैश्विक एआई उद्योग में तेजी से विकास के दौर में, अमेरिकी एआई स्टार्टअप कंपनी एंथ्रोपिक ने 24 जून को आधिकारिक रूप से घोषणा की कि वह इस गर्मी में टोक्यो में अपना पहला एशिया-प्रशांत क्षेत्रीय कार्यालय खोलेगी। यह घोषणा भले ही जापान और पूरे एशिया-प्रशांत क्षेत्र में एआई पारिस्थितिकी तंत्र को नए ऊर्जा से भर देगी। एंथ्रोपिक की स्थापना 2020 में की गई थी और यह मानव केंद्रित एआई तकनीक विकसित करने में लगी हुई है, जिसका विचार एक सुरक्षित और नियंत्रित एआई प्रणाली बनाकर समाज के लिए बेहतर तकनीक के उपयोग को बढ़ावा देना है। इस क्षेत्र में कंपनी के पास अपनी अग्रणी स्थिति है।

Jun 25, 2025

एम्स डॉक्टर के अतिरिक्त उपयोगिता के साथ मेडिकल मॉडल V2. अंतरराष्ट्रीय संस्करण जारी करें!

Jun 25, 2025

पाठ से निर्देश संपादन तक ओम्नीजेन2 ओपन सोर्स बहुमाध्यमिक मॉडल के अनुप्रयोग क्षेत्र को पुनर्जीवित करता है

Jun 24, 2025

DeepSite V2 का अपग्रेड! DeepSeek-R1-0528 मॉडल का समर्थन करता है, 3D वेब पेज एनिमेशन आसानी से बनाएं, कोड के बिना भी सृजनशीलता का ख़िलाफ़ जा सकते हैं!

Jun 19, 2025

Anthrropic स्वचालित रूप से व्याख्यात्मक AI पर शोध आगे बढ़ती हैं, यह कंपनी कंपनियों के महाकाल-भाषा-मॉडल रणनीति को पुनर्निर्माण कर सकती है

AI शोध कंपनी Anthropic एक 'व्याख्यात्मक' AI प्रणाली विकसित कर रही है, जो प्रौद्योगिकी जो उपयोगकर्ताओं को महाकाल-भाषा-मॉडल (LLM) के निर्णय प्रक्रिया को समझने में मदद कर सकती है। इस तकनीकी चमत्कार ने महाकाल-भाषा-मॉडल अनुप्रयोगों के क्षेत्र में प्रभावशाली परिणाम पैदा किए है। प्रौद्योगिकी का तख्तापलट: AI के 'ब्लैक-बॉक्स' की छटनी संस्थापित करना । Anthropic का शोध महाकाल-भाषा-मॉडल वर्तमान प्रणाली की 'ब्लैक-बॉक्स' समस्या का संसाधन करने पर केंद्रित है।

Jun 18, 2025

LLM SEO Monitor के गहरे मूल्यांकन: AI सर्च इंजिन ओप्टीमाइजेशन के लिए आवश्यक उपकरण

LLM SEO Monitor उपकरण के फ़ंक्शंस और उपयोगी प्रयोग के बारे में विस्तृत विश्लेषण। ChatGPT, Gemini आदि AI सर्च इंजिन में ब्रांड के दिखने का स्तर बढ़ाने के लिए विशेषज्ञ पर्यवेक्षण के माध्यम से व्यवसायिक मूल्यांकन प्राप्त करें।

Jun 17, 2025

Kimi-Dev-72B: खोल संपत्ति कोडिंग LLM सॉफ़्टवेयर इंजीनिअरिंग समस्याओं का समाधान करने में सक्षम

Jun 17, 2025

LLM SEO Monitor की审评: AI काल में ब्रँड खोज सॉर्ट करने के लिए आवश्यक उपकरण

ChatGPT, Google Gemini जैसे AI सहयोगी सॉर्टस पर ब्रँड का प्रदर्शन निगरानी करने में LLM SEO Monitor इस क्रांतिकारी उपकरण के माध्यम से गहराई से समझें। इसके कोर के फ़ंक्शन, पाठ्य सामग्री और अंतर्निहित विशिष्टताओं, इस उपकरण का प्रयोग करके ब्रँड युगल में नई प्रतिस्पर्धा बनाईए।

Jun 16, 2025

बायटूप द्वारा Seaweed APT2 का शानदार लॉन्च! रियल-टाइम इंटरैक्टिव AI वीडियो जनरेशन, 3D वर्चुअल वर्ल्ड के नया युग को खोलता है

Jun 16, 2025

मीटा ने वाइजेपा 2 का घोर रिलीज किया: वीडियो समझौता में नई तकनीकी चुनौती, शून्य-नमूना रोबोट कंट्रोल भविष्य का नेतृत्व करता है!

मीटा एआई अनुसंधान टीम ने फिर से आईएआई के क्षेत्र में कठिन पहलू पर ब्रेक थ्रू किया, 2025 के जून 11 को इस नवीन वीडियो समझौता मॉडल - V-JEPA2 (Video Joint Embedding Predictive Architecture2) का आधिकारिक रिलीज किया। यह मॉडल मीटा के मुख्य एआई वैज्ञानिक Yann LeCun द्वारा विकसित किया गया है, जिसने इसकी नवगति स्व-सूचना अधिगम तकनीक और शून्य-नमूना रोबोट कंट्रोल क्षमता के साथ वीडियो समझौता और भौतिक विश्व मॉडलिंग में नई राह पेश की है।

Jun 12, 2025

AI समाचार

AI दैनिक

AI समयरेखा

अल हार्डवेयर

नवीनतम मामले

छवि संग्रह

वीडियो संग्रह

ऑडियो संग्रह

सामग्री संग्रह

नवीनतम ट्यूटोरियल

AI उत्पाद रैंकिंग

AI ट्रैफ़िक वृद्धि रैंकिंग

AI ट्रैफ़िक गिरावट रैंकिंग

AI साप्ताहिक रैंकिंग

संयुक्त राज्य अमेरिका

चीन

भारत

ब्राजील

छवि निर्माण

निजी सहायक

चरित्र निर्माण

वीडियो निर्माण

AI प्रोजेक्ट रैंकिंग

AI प्रोजेक्ट विकास रैंकिंग

AI डेवलपर रैंकिंग

AI संगठन रैंकिंग

डीपसीक

TTS

LLM

ChatGPT

अवलोकन