आलीबाबा के कृत्रिम बुद्धिमत्ता विभाग ने आज Qwen3-VL दृश्य-भाषा मॉडल श्रृंखला के संक्षिप्त संस्करण का औपचारिक रूप से उद्घाटन किया, जिसमें 4 अरब और 8 अरब पैरामीटर के संस्करण शामिल हैं। इस कदम ने उन्नत बहुमाध्यम एआई तकनीक के किनारे के उपकरणों और संसाधन सीमित वातावरणों में अधिक व्यापक उपयोग के लिए महत्वपूर्ण कदम उठाया।

प्रदर्शन में उछाल, छोटे मॉडल बड़े दिग्गजों के बराबर

इस बार प्रस्तुत किए गए 4B और 8B मॉडल दोनों Instruct और Thinking संस्करण में उपलब्ध हैं, और STEM तर्क, दृश्य प्रश्न-उत्तर (VQA), प्रकाशीय अक्षर पहचान (OCR), वीडियो समझ और एजेंट कार्यों जैसी मुख्य बहुमाध्यम क्षमताओं के लिए अनुकूलित हैं।

प्रकाशित मानक परीक्षण परिणामों के अनुसार, ये छोटे मॉडल कई श्रेणियों में अच्छा प्रदर्शन करते हैं, जो गेमिनी 2.5 Flash Lite और GPT-5 Nano जैसे प्रतिद्वंद्वियों के ऊपर भी खड़े हो जाते हैं। अधिक ध्यान आकर्षित करने वाली बात यह है कि कुछ क्षेत्रों में उनका प्रदर्शन केवल छह महीने पहले जारी किए गए बड़े पैमाने पर Qwen2.5-VL-72B मॉडल के बराबर हो सकता है, जो बहुत अधिक पैरामीटर दक्षता दर्शाता है।

QQ20251015-103538.png

संसाधन अनुकूलन, AI के लिए लोकतंत्रवाद के लिए आगे बढ़े

नए मॉडल के मुख्य लाभ में वीआरएम उपयोग में महत्वपूर्ण कमी है, जिसके कारण उन्हें उपभोक्ता स्तर के हार्डवेयर जैसे लैपटॉप और स्मार्टफोन पर सीधे चलाया जा सकता है। दक्षता में सुधार के लिए, आलीबाबा ने एफपी8 क्वांटाइजेशन संस्करण भी प्रदान किया है, जो आधारभूत क्षमताओं के बिना संसाधन खपत को और कम करता है। जैसा कि Qwen टीम के एक विकासकर्ता ने कहा: "छोटे VL मॉडल डेप्लॉयमेंट के लिए उपयुक्त हैं और मोबाइल और रोबोटिक्स क्षेत्रों में महत्वपूर्ण महत्व रखते हैं।"

तेजी से अपडेट, ओपन सोर्स साझा

इस छोटे मॉडल के उद्घाटन ने सितंबर में प्रस्तुत किए गए Qwen3-VL श्रृंखला (शीर्ष मॉडल के 235 अरब पैरामीटर) के मार्ग का अनुसरण किया। पहले, आलीबाबा ने अक्टूबर के शुरू में 30B-A3B वेरिएंट जारी किया था, जिसमें केवल 30 अरब सक्रिय पैरामीटर के साथ GPT-5Mini और Claude4Sonnet के समान मानक परीक्षण परिणाम प्राप्त हुए। इस तेजी से अपडेट को उद्योग में आलीबाबा के उच्च क्षमता एआई के लोकतंत्रीकरण के लिए मजबूत उदाहरण के रूप में देखा गया, विशेष रूप से रोबोटिक्स जैसे शारीरिक प्रणालियों के लिए।

पता:

https://huggingface.co/collections/Qwen/qwen3-vl-68d2a7c1b8a8afce4ebd2dbe

https://github.com/QwenLM/Qwen3-VL/tree/main/cookbooks