एक अक्टूबर 2025 को, Qwen-Image, पहला छवि उत्पादन मूल मॉडल, जिसके 20 बिलियन पैरामीटर हैं, MMDiT (मल्टीमीडिया डिफ्यूज़न ट्रांसफॉर्मर) मॉडल ने आधिकारिक रूप से खुला स्रोत बना दिया। इस मॉडल ने टेक्स्ट रेंडरिंग और छवि संपादन के क्षेत्र में महत्वपूर्ण अभियान किया। यह मॉडल विभिन्न प्रमुख मानक परीक्षण में SOTA (शीर्ष प्रदर्शन) प्राप्त करता है और जटिल टेक्स्ट रेंडरिंग और शुद्ध छवि संपादन में एक निर्णायक लाभ प्रदर्शित करता है।

तकनीकी अभियान: तीन मुख्य क्षमताएं पूर्ण रूप से अग्रणी

Qwen-Image का सबसे बड़ा आकर्षण तीन मुख्य तकनीकी क्षमताओं में वृद्धि है। पहला, अद्वितीय टेक्स्ट रेंडरिंग क्षमता। पारंपरिक छवि उत्पादन मॉडल लिखित सामग्री के साथ काम करते समय अक्सर फॉन्ट विकृति, सामग्री गलति या व्यवस्था असंगति के साथ निपटते हैं, Qwen-Image नए MMDiT आर्किटेक्चर के माध्यम से इन चुनौतियों को प्रभावी ढंग से हल करता है। यह मॉडल विभिन्न जटिल परिस्थितियों में उच्च गुणवत्ता वाले टेक्स्ट रेंडरिंग कर सकता है, चाहे वह चीनी और अंग्रेजी मिश्रित हो या लंबे अनुच्छेद टेक्स्ट उत्पादन हो, यह बहुत उच्च सटीकता के साथ काम करता है।

image.png

छवि संपादन में, Qwen-Image अपनी अद्वितीय समांतर संपादन क्षमता के साथ अभियान करता है। उपयोगकर्ता छवि के बारे में निर्देश दे सकते हैं, और मॉडल विशिष्ट निर्देशों के अनुसार सटीक रूप से संपादन करता है, बिना मूल छवि के स्वर और संरचना के बदले। इस समांतर संपादन क्षमता के लिए विशेष डिजाइन कार्य बहुत महत्वपूर्ण है, छवि संसाधन की दक्षता और गुणवत्ता में बहुत बढ़ोतरी करता है।

अंतर-मानक प्रदर्शन Qwen-Image का तीसरा लाभ है। इस मॉडल ने GenEval, DPG, OneIG-Bench आदि जैसे सामान्य छवि उत्पादन परीक्षण में अच्छा प्रदर्शन किया, GEdit, ImgEdit, GSO आदि छवि संपादन बेंचमार्क में भी शीर्ष स्थान प्राप्त किया, लंबे टेक्स्ट बेंचमार्क, चाइनीज़ वर्ड, टेक्स्ट क्राफ्ट आदि टेक्स्ट रेंडरिंग मूल्यांकन में भी पूर्ण रूप से अग्रणी है। इस पूर्ण विश्व स्तर के प्रदर्शन के लाभ ने मॉडल आर्किटेक्चर डिजाइन की उन्नतता और प्रशिक्षण रणनीति की प्रभावशीलता की पुष्टि की है।

अनुप्रयोग: व्यावसायिक डिजाइन से दैनिक रचनात्मकता तक

Qwen-Image की वास्तविक अनुप्रयोग क्षमता विभिन्न परिस्थितियों में पूर्ण रूप से प्रदर्शित हो गई। पोस्टर बनाने के क्षेत्र में, यह मॉडल निर्दिष्ट डिजाइन शैली की शुद्धता के साथ अच्छी तरह से अनुकरण कर सकता है, और व्यक्ति के आंतरिक भावना और आकृति के विवरण के साथ, उपयोगकर्ता द्वारा निर्दिष्ट चीनी और अंग्रेजी लिखित सामग्री के सटीक उत्पादन कर सकता है। इस क्षमता के लिए विज्ञापन डिजाइन, प्रचार सामग्री बनाने आदि व्यावसायिक अनुप्रयोग में महत्वपूर्ण मूल्य है।

आउटपुट के विभिन्न घटकों के लिए डिजाइन कार्य में, Qwen-Image व्यापक व्यवस्था योजना क्षमता के साथ अभियान करता है। यह जटिल व्यवस्था डिजाइन कर सकता है, और विभिन्न घटकों के लिए उपयुक्त आइकन, शीर्षक और परिचय पाठ उत्पादन कर सकता है, जिससे समग्र डिजाइन की समन्वित एकरूपता प्राप्त होती है। यह क्षमता व्यापक रूप से व्यापार परिचय पुस्तिका, उत्पाद निर्देश आदि जैसे सटीक व्यवस्था के आवश्यकता वाले परिस्थितियों के लिए विशेष रूप से उपयोगी है।

हालांकि, छोटे क्षेत्र में लंबे पाठ उत्पादन के लिए चुनौतिपूर्ण कार्य में, Qwen-Image अच्छा प्रदर्शन बरकरार रखता है। चाहे कागज का क्षेत्र कितना भी छोटा हो या अनुच्छेद कितना भी लंबा हो, मॉडल लिखित सामग्री को सटीक रूप से उत्पादित कर सकता है, और चीनी और अंग्रेजी के बीच लचीले स्विचिंग समर्थन कर सकता है। इस क्षमता के कारण चिट्ठी डिजाइन, टैग बनाने आदि सूक्ष्म अनुप्रयोगों के लिए एक शक्तिशाली तकनीकी समर्थन प्रदान किया गया है।

कला प्रदर्शन: विविध शैली रचनात्मक क्षमता

सामान्य छवि उत्पादन में, Qwen-Image विस्तृत कला शैली रचनात्मकता के समर्थन करता है। फोटो-स्तरीय वास्तविकता से लेकर कल्पनाशील आइम्प्रेशनिस्ट चित्रकला तक, लोकप्रिय एनिमेशन शैली से लेकर सरल आधुनिक न्यूनतम डिजाइन तक, मॉडल उपयोगकर्ता के रचनात्मक संकेतों के लिए लचीले रूप से प्रतिक्रिया कर सकता है। इस विविध शैली समायोजन क्षमता के कारण यह विशेष रूप से व्यावसायिक डिजाइन कार्य के लिए उपयोगी है और सामान्य उपयोगकर्ताओं के रचनात्मक अभिव्यक्ति के लिए एक शक्तिशाली उपकरण प्रदान करता है।

मॉडल की शैली परिवर्तन क्षमता विशेष रूप से ध्यान देने योग्य है। उपयोगकर्ता सरल लिखित वर्णन के माध्यम से एक ही विषय के सामग्री के अलग-अलग दृश्य प्रभाव प्रदर्शित कर सकते हैं। इस लचीलापन के कारण कला निर्माताओं के लिए अधिक रचनात्मक संभावनाएं प्रदान की जाती हैं, जो नए डिजाइन विचारों और अभिव्यक्ति तरीकों के उत्पादन में सहायता करता है।

ओपन सोर्स रणनीति: उद्योग पारिस्थितिकी प्रगति को बढ़ावा देना