अलीबाबा **Qwen (टॉनगई क्वेन)** टीम हाल ही में दो नए छोटे बहुमाध्यमिक मॉडल जारी कर चुकी है: Qwen3-VL-30B-A3B-Instruct और Qwen3-VL-30B-A3B-Thinking। प्रत्येक मॉडल में 3 अरब सक्रिय पैरामीटर हैं, लेकिन इसके प्रदर्शन में बड़ा लक्ष्य है।
Qwen टीम के अनुसार, ये दो नए संस्करण GPT-5-Mini और Claude4Sonnet जैसे शीर्ष मॉडलों के साथ प्रतिस्पर्धा करने के लिए बनाए गए हैं और कुछ मानक परीक्षणों में गणित, छवि स्वीकृति, पाठ स्वीकृति, वीडियो संसाधन और एजेंट नियंत्रण जैसे महत्वपूर्ण क्षेत्रों में अधिक क्षमता दिखाते हैं।
इस श्रृंखला में तेज अनुमान के लिए FP8 संस्करण भी शामिल है, साथ ही Qwen3-VL-235B-A22B मॉडल का FP8 विकल्प भी शामिल है।
इन मॉडल को पूरी तरह से उपलब्ध कराया गया है, उपयोगकर्ता और विकासकर्ता HuggingFace, ModelScope और GitHub से डाउनलोड कर सकते हैं, या अलीबाबा के API का उपयोग करके उपयोग कर सकते हैं। इसके अलावा, Qwen एक तत्काल उपयोग के लिए वेब चैट इंटरफेस भी प्रदान करता है। इस जारीकरण ने Qwen टीम के उच्च दक्षता और उच्च प्रदर्शन वाले छोटे मॉडलों के विस्तार के प्रयासों को बल दिया।