26 जून 2025 को, बाइटडेंस ने अपनी नवीनतम छवि संश्लेषण तकनीक - XVerse का आधिकारिक रूप से उद्घाटन किया, जिसका उद्देश्य उच्च-सटीक बहु-विषय छवि उत्पादन समाधान प्रदान करना है। यह नवाचार तकनीक उपयोगकर्ताओं को बहुत सारे व्यक्तियों के एकाधिक नियंत्रण की अनुमति देती है, जो व्यक्तिगत और जटिल दृश्यों के उत्पादन में बहुत अधिक क्षमता बढ़ाती है।

XVerse का केंद्र इसकी अद्वितीय DiT मॉडुलेशन विधि में है, जो प्रत्येक विषय के पहचान और अर्थवाही गुणों के नियमन की अनुमति देती है बिना किसी भी छवि लेटेंट विशेषताओं के समग्र प्रभाव के। रेफरेंस छवियों को टोकन-विशिष्ट टेक्स्ट स्ट्रीम ऑफसेट में बदलकर, XVerse छवि संश्लेषण को अधिक लचीला और स्पष्ट बनाता है। उपयोगकर्ता केवल सरल टेक्स्ट विवरण के साथ अपेक्षित उच्च-गुणवत्ता छवियां उत्पन्न कर सकते हैं।

QQ20250701-102724.png

तकनीकी कार्यान्वयन के संदर्भ में, XVerse के उपयोगकर्ताओं को पहले Python3.10.16 के साथ एक conda वातावरण बनाना होता है और संबंधित डिपेंडेंसीज स्थापित करना होता है। बाद में, उपयोगकर्ताओं को संबंधित चेकपॉइंट और चेहरा पहचान मॉडल डाउनलोड करने की आवश्यकता होती है ताकि तकनीक के चलने में कोई समस्या न हो। ध्यान देने योग्य बात यह है कि XVerse एक अंतरक्रियात्मक Gradio डेमो प्रदान करता है, जो उपयोगकर्ताओं को छवियां अपलोड करने और विवरण देने की अनुमति देता है जो वास्तविक समय में छवियां उत्पन्न करते हैं, और बहुत सारे पैरामीटर के साथ उत्पादन परिणामों को अनुकूलित कर सकते हैं।

XVerse उपयोगकर्ता-अनुकूल इंटरफेस के साथ आता है और विभिन्न प्रकार के इनपुट सेटिंग विकल्प प्रदान करता है, जैसे छवि विवरण, उत्पादित छवि की ऊंचाई और चौड़ाई, जिससे उपयोगकर्ता उत्पादित छवि के विशेषताओं को लचीले ढंग से समायोजित कर सकते हैं। इसके अलावा, उपयोगकर्ता "डिटेक्शन एंड सेगमेंटेशन" विशेषता का उपयोग करके अपलोड की गई छवि का विश्लेषण कर सकते हैं, चेहरों को स्वचालित रूप से काट सकते हैं और संबंधित विवरण उत्पन्न कर सकते हैं, जिससे उत्पादन की सटीकता और व्यक्तिगतता में वृद्धि होती है।

समाप्ति में, XVerse, एक क्रांतिकारी तकनीक के रूप में, छवि संश्लेषण के व्यापक संभावनाओं को दर्शाता है और डिजिटल सामग्री निर्माण, विज्ञापन और कला जैसे विभिन्न क्षेत्रों में गहरा प्रभाव डालने की उम्मीद है। भविष्य के संस्करणों के उद्घाटन के साथ, XVerse एक उद्योग मानक बनने की उम्मीद है, जो अधिक रचनात्मकता के वास्तविकीकरण में मदद करेगा।

alag: https://github.com/bytedance/XVerse