MiniMax के Hailuo AI ने हाल ही में Hailuo Image का एक नया फीचर, Character Reference लॉन्च किया है, जो AI इमेज जेनरेशन के क्षेत्र में एक क्रांतिकारी बदलाव ला रहा है। AIbase के अनुसार, यह फीचर यूज़र्स को एक सिंगल रेफरेंस इमेज के आधार पर मल्टीपल एंगल्स, डायनामिक पोज़ और एक्सप्रेशन्स वाले कैरेक्टर इमेज जेनरेट करने की अनुमति देता है। इसमें फ़िल्मी लाइटिंग और कंपोज़िशन का सपोर्ट है और यह कम्पलीट प्रॉम्प्ट कंट्रोल भी प्रदान करता है। कम्युनिटी ने इस फीचर के लॉन्च पर बहुत ही सकारात्मक प्रतिक्रिया दी है। प्रोजेक्ट की डिटेल्स Hailuo की वेबसाइट और GitHub पर पब्लिकली उपलब्ध हैं, जो कैरेक्टर कंसिस्टेंसी और क्रिएटिव एक्सप्रेशन में Hailuo की बड़ी तरक्की को दर्शाता है। AIbase आपको इसकी डिटेल रिपोर्ट प्रदान करता है।

image.png

मुख्य फीचर: एक सिंगल इमेज से डायनामिक कैरेक्टर जेनरेशन

Hailuo Image का Character Reference फीचर अपनी बेहतरीन कैरेक्टर कस्टमाइज़ेशन क्षमता के साथ AI इमेज जेनरेशन को एक नया आयाम दे रहा है। AIbase ने इसके मुख्य फीचर्स को इस प्रकार सूचीबद्ध किया है:

मल्टीपल एंगल्स और डायनामिक पोज़: एक सिंगल रेफरेंस इमेज के आधार पर, यह विभिन्न एंगल्स (सामने से, बाजू से, तीन-चौथाई एंगल आदि) और पोज़ (जैसे खड़ा होना, दौड़ना, कूदना) में कैरेक्टर इमेज जेनरेट करता है, जिससे कैरेक्टर के फीचर्स बिलकुल मिलते-जुलते रहते हैं।

अधिक एक्सप्रेशन्स कंट्रोल: यह विभिन्न प्रकार के कैरेक्टर एक्सप्रेशन्स जेनरेट करने में सक्षम है, खुशी, ध्यान से लेकर उदासी तक, जिससे भावनाओं का प्राकृतिक और जीवंत प्रदर्शन सुनिश्चित होता है, जो कहानी कहने और ब्रांड कंटेंट क्रिएशन के लिए उपयुक्त है।

फ़िल्मी लाइटिंग और कंपोज़िशन: यह प्रोफ़ेशनल लेवल के लाइटिंग इफ़ेक्ट्स, जैसे गोल्डन आवर लाइटिंग, लो-एंगल ड्रामैटिक लाइटिंग प्रदान करता है और विज़ुअल इम्पैक्ट को बढ़ाने के लिए कंपोज़िशन को ऑप्टिमाइज़ करता है, जिससे परिणाम फ़िल्मी दृश्यों जैसा होता है।

कम्पलीट प्रॉम्प्ट कंट्रोल: यूज़र्स डिटेल्ड टेक्स्ट प्रॉम्प्ट्स के ज़रिए कैरेक्टर के कपड़े, बैकग्राउंड, सीन स्टाइल (जैसे साइबरपंक या फ़ैंटेसी) को एडजस्ट कर सकते हैं, जिससे बेहद पर्सनलाइज़्ड क्रिएशन संभव होता है।

AIbase ने देखा कि कम्युनिटी टेस्ट में, यूज़र्स ने एक एनिमे कैरेक्टर इमेज अपलोड की और प्रॉम्प्ट "भविष्य के योद्धा के कवच पहनकर, नियॉन शहर में दौड़ते हुए, बाजू से एंगल, रात की फ़िल्मी लाइटिंग" के साथ बेहद मिलती-जुलती डायनामिक इमेज जेनरेट की, जिससे विज्ञापन और फिल्मों के प्री-विज़ुअलाइज़ेशन में इस फीचर की क्षमता का पता चलता है।

टेक्नोलॉजी आर्किटेक्चर: डीप लर्निंग से संचालित कैरेक्टर कंसिस्टेंसी

Hailuo Image Character Reference फीचर MiniMax के S2V-01 मॉडल आर्किटेक्चर पर आधारित है, जिसमें एडवांस्ड डिफ़्यूज़न ट्रांसफ़ॉर्मर (DiT) और डीप लर्निंग एल्गोरिदम का इस्तेमाल किया गया है। AIbase के विश्लेषण के अनुसार, इसकी मुख्य टेक्नोलॉजी में शामिल हैं:

सिंगल इमेज कैरेक्टर एनालिसिस: एक विशेष आइडेंटिटी रेफरेंस नेटवर्क के ज़रिए, यह रेफरेंस इमेज से मुख्य फीचर्स (जैसे चेहरे की बनावट, हेयरस्टाइल, स्किन टोन) निकालता है, जिससे विभिन्न परिस्थितियों में विज़ुअल कंसिस्टेंसी सुनिश्चित होती है।

डायनामिक फीचर जेनरेशन: 3D वेरिएशनल ऑटोएन्कोडर (VAE) और ट्रांसफ़ॉर्मर लेयर का उपयोग करके, यह मल्टीपल एंगल्स और पोज़ में कैरेक्टर इमेज जेनरेट करता है, जिससे जटिल एक्शन और एक्सप्रेशन्स का प्राकृतिक संक्रमण संभव होता है।

प्रॉम्प्ट ऑप्टिमाइज़ेशन इंजन: इसमें एक इनबिल्ट प्रॉम्प्ट ऑप्टिमाइज़र है जो यूज़र द्वारा दिए गए टेक्स्ट डिस्क्रिप्शन को स्वतः बेहतर बनाता है, जिससे यह सुनिश्चित होता है कि परिणाम क्रिएटिव इरादे से पूरी तरह मेल खाते हैं।

हाई-एफ़िशिएंसी रेंडरिंग: ऑप्टिमाइज़ की गई इन्फ़्रेंस प्रक्रिया हाई-रेज़ोल्यूशन इमेज (अधिकतम 1080p) को तेज़ी से जेनरेट करने में सक्षम है, एक इमेज जेनरेट करने में केवल कुछ सेकंड का समय लगता है, जो इटरेटिव क्रिएशन के लिए उपयुक्त है।

यह फीचर सिंगल इमेज इनपुट (अधिकतम 20MB) को सपोर्ट करता है, और बेहतर परिणाम के लिए हाई-रेज़ोल्यूशन फ्रंटल पोर्ट्रेट का उपयोग करने की सलाह दी जाती है। AIbase का मानना है कि इसकी कम कम्प्यूटेशनल कॉस्ट (पारंपरिक तरीकों की तुलना में केवल 1%) और ओपन-सोर्स कोड पैकेज डेवलपर्स को व्यापक कस्टमाइज़ेशन स्पेस प्रदान करते हैं।

एप्लिकेशन परिदृश्य: क्रिएटिव डिज़ाइन से लेकर कमर्शियल डिप्लॉयमेंट तक

Character Reference फीचर के लॉन्च ने कई क्षेत्रों के क्रिएटर्स और कंपनियों के लिए व्यापक एप्लिकेशन संभावनाएँ खोली हैं। AIbase ने इसके मुख्य परिदृश्यों को इस प्रकार संक्षेपित किया है:

फ़िल्में और एनिमेशन: कैरेक्टर कॉन्सेप्ट आर्ट और डायनामिक प्रीव्यू को तेज़ी से जेनरेट करना, कैरेक्टर कंसिस्टेंसी बनाए रखना, प्रारंभिक डिज़ाइन चक्र को कम करना, इंडिपेंडेंट एनिमेशन और बड़े फ़िल्मी प्रोजेक्ट्स के लिए उपयुक्त है।

गेम डेवलपमेंट: मल्टीपल एंगल्स वाले कैरेक्टर आर्ट और डायनामिक पोज़ जेनरेट करना, 2D/3D गेम्स के कैरेक्टर डिज़ाइन और एक्शन टेस्टिंग में सहायक, डेवलपमेंट प्रक्रिया को तेज करता है।

ब्रांड मार्केटिंग: ब्रांड के मस्कॉट या ब्रांड एम्बेसडर के लिए विभिन्न प्रकार की इमेज जेनरेट करना, जैसे विभिन्न कपड़े, परिदृश्य या एक्सप्रेशन्स वाले विज्ञापन मटीरियल, ब्रांड की पहचान को बढ़ाता है।

सोशल मीडिया कंटेंट: क्रिएटर्स पर्सनलाइज़्ड एनिमे या रियलिस्टिक कैरेक्टर इमेज जेनरेट कर सकते हैं, जो TikTok, Instagram जैसे प्लेटफ़ॉर्म्स पर शॉर्ट वीडियो और स्टैटिक कंटेंट की ज़रूरतों के अनुकूल हैं।

कम्युनिटी फ़ीडबैक से पता चलता है कि यह फीचर एशियाई कैरेक्टर और एनिमे स्टाइल इमेज जेनरेट करने में विशेष रूप से बेहतरीन प्रदर्शन करता है, और इसके परिणामों की डिटेल टेक्सचर और एक्सप्रेशन कंट्रोल को "इंडस्ट्री लीडिंग" माना जाता है। AIbase ने देखा है कि Hailuo के वीडियो जेनरेशन टूल के साथ इसका सहज एकीकरण स्टैटिक इमेज से डायनामिक वीडियो के वर्कफ़्लो की दक्षता को और बढ़ाता है।

प्रारंभिक गाइड: आसान ऑपरेशन, तेज़ क्रिएशन

AIbase को पता चला है कि Hailuo Image Character Reference फीचर वेब एंड और API के ज़रिए इंट्यूटिव ऑपरेशन एक्सपीरियंस प्रदान करता है। यूज़र्स निम्नलिखित चरणों का पालन करके इसे आसानी से इस्तेमाल कर सकते हैं:

Hailuo AI की वेबसाइट (hailuoai.video) पर जाएँ, लॉगिन करें और Image Creation पेज पर जाएँ;

एक सिंगल रेफरेंस इमेज अपलोड करें (सामने से ली गई पोर्ट्रेट, PNG/JPEG फ़ॉर्मेट की सलाह दी जाती है);

प्रॉम्प्ट डालें, कैरेक्टर के एक्शन, एक्सप्रेशन, कपड़े, बैकग्राउंड आदि का वर्णन करें, उदाहरण के लिए "कैरेक्टर लाल रंग का केप पहने हुए, बर्फ़ीले पहाड़ की चोटी पर खड़ा है, ऊपर से एंगल, महाकाव्य लाइटिंग";

स्टाइल चुनें (जैसे रियलिस्टिक, एनिमे, साइबरपंक) और इमेज जेनरेट करें, रीयल-टाइम प्रीव्यू और एडजस्टमेंट का सपोर्ट है;

इमेज डाउनलोड करें या सीधे वीडियो में कन्वर्ट करें, PNG या MP4 फ़ॉर्मेट में एक्सपोर्ट करें।

कम्युनिटी बेहतर परिणाम के लिए डिटेल्ड प्रॉम्प्ट्स ("लो-एंगल, डायनामिक पोज़, गोल्डन आवर लाइटिंग" जैसे) के उपयोग की सलाह देती है, और वीडियो एक्सटेंशन के लिए Hailuo के S2V-01 मॉडल के साथ उपयोग करने की सलाह दी जाती है। AIbase याद दिलाता है कि पहली बार उपयोग करने पर यह सुनिश्चित करना ज़रूरी है कि इमेज स्पष्ट हो और बैकग्राउंड में ज़्यादा इंटरफ़ेरेंस न हो, ताकि कैरेक्टर एक्सट्रैक्शन की सटीकता बढ़ाई जा सके।

कम्युनिटी प्रतिक्रिया और सुधार की दिशा

Character Reference फीचर के लॉन्च के बाद, कम्युनिटी ने इसकी कैरेक्टर कंसिस्टेंसी और प्रॉम्प्ट कंट्रोल क्षमता की बहुत तारीफ़ की है। डेवलपर्स ने इसे "सिंगल इमेज जेनरेशन को एक नया आयाम देने वाला" बताया है, खासकर एनिमे और विज्ञापन क्रिएशन में इसका प्रदर्शन बेहद प्रभावशाली रहा है। हालाँकि, कुछ यूज़र्स ने प्रॉम्प्ट के जटिल सीन डिस्क्रिप्शन के कारण मामूली एनवायरमेंट डिफ़ॉर्मेशन की समस्या बताई है, और मल्टी-सब्जेक्ट रेफरेंस सपोर्ट को बढ़ाने का सुझाव दिया है। कम्युनिटी 3D कैरेक्टर जेनरेशन और रीयल-टाइम इंटरेक्टिव एप्लिकेशन में फीचर के विस्तार की भी उम्मीद कर रही है। MiniMax ने बताया है कि भविष्य के अपडेट में मल्टी-लैंग्वेज प्रॉम्प्ट प्रोसेसिंग और ऑब्जेक्ट और सीन कंसिस्टेंसी को ऑप्टिमाइज़ किया जाएगा, जिससे क्रिएशन की प्रक्रिया और आसान हो जाएगी। AIbase का अनुमान है कि यह फीचर Blender, Unity जैसे टूल्स के साथ इंटीग्रेट हो सकता है, जिससे इमेज से 3D एनिमेशन तक का पूरा AI क्रिएशन इकोसिस्टम बन सकता है।

वेबसाइट का पता: https://hailuoai.video/create