Flux हाल ही में कई मॉडल प्रेमियों से प्रशंसा प्राप्त कर रहा है, इसकी चित्र गुणवत्ता SD3 और MJ से बेहतर है, कई लोग कहते हैं कि Flux वास्तव में सबके लिए SD3 है, इसलिए मैं भी Flux की क्षमता को लेकर बहुत उत्सुक हूँ, और इस प्रक्रिया को सबके साथ साझा करना चाहता हूँ।

आधिकारिक वेबसाइट का संदर्भ चित्र:

image.png

Flux की आधिकारिक वेबसाइट: https://blackforestlabs.ai/

आर्टिफिशियल इंटेलिजेंस स्टार्टअप Black Forest Labs ने कंपनी की स्थापना की और अपना पहला टेक्स्ट-टू-इमेज आर्टिफिशियल इंटेलिजेंस मॉडल FLUX.1 जारी किया। यह कंपनी जर्मनी में स्थित है और इसे Stable Diffusion के शोधकर्ताओं ने स्थापित किया है, जिसका उद्देश्य चित्रों और वीडियो के लिए उन्नत जनरेटिव आर्टिफिशियल इंटेलिजेंस बनाना है।

मॉडल कुल तीन प्रकार में विभाजित हैं: pro संस्करण, dev संस्करण, और schnell संस्करण।

Black Forest के ग्राफ़ का दावा है कि इसके Pro और Dev मॉडल अब तक के सबसे अच्छे इमेज जनरेटर हैं, जबकि इसके कमजोर Schnell का स्थान Midjourney v5 और Ideogram के बीच है।

image.png

इन तीन संस्करणों का विवरण:

  • Pro संस्करण का प्रदर्शन सबसे अच्छा है, लेकिन यह बंद स्रोत है, API के लिए शुल्क लिया जाता है।

  • Dev संस्करण ओपन-सोर्स है लेकिन इसका व्यावसायिक उपयोग नहीं किया जा सकता, इसे चलाने के लिए कम से कम 24G वीडियो मेमोरी की आवश्यकता है।

  • Schnell संस्करण ओपन-सोर्स है और व्यावसायिक उपयोग के लिए उपलब्ध है।

यदि आप ऑनलाइन अनुभव करना चाहते हैं, तो यहां ऑनलाइन वेबसाइटें भी हैं:

schnell: https://replicate.com/black-forest-labs/flux-schnell

dev: https://replicate.com/black-forest-labs/flux-dev

pro: https://replicate.com/black-forest-labs/flux-pro

स्थानीय तैनाती

वर्तमान में ComfyUI का नवीनतम संस्करण FLux मॉडल के साथ संगत है, आपको बस अपने कोर को नवीनतम संस्करण में अपडेट करने की आवश्यकता है।

इसलिए हम पहले ComfyUI को अपडेट कर रहे हैं।

यदि आप आधिकारिक ComfyUI इंटीग्रेशन पैक का उपयोग कर रहे हैं, तो इस अपडेट पर क्लिक करें।

image.png

यदि आप Qiuyue के लांचर का उपयोग कर रहे हैं, तो नीचे दिए गए उदाहरण के अनुसार कोर को अपडेट करें।

image.png

जिनके पास बहुत कम वीडियो मेमोरी है, उनके लिए स्थानीय रूप से चलाना मुश्किल हो सकता है, मेरी स्थानीय कंप्यूटर कॉन्फ़िगरेशन ठीक है, यहाँ मैं schnell संस्करण का अनुभव कर रहा हूँ।

बड़ा मॉडल डाउनलोड करें: https://huggingface.co/black-forest-labs/FLUX.1-schnell/tree/main

यह लिंक 23.8GB के बड़े मॉडल और 335MB के VAE मॉडल को प्रदान करता है, हमें दोनों डाउनलोड करने की आवश्यकता है।

  • डाउनलोड पूरा होने के बाद, बड़े मॉडल को: ComfyUI/models/unet/ फ़ोल्डर में रखें।

  • VAE को आपके ComfyUI/models/vae/ फ़ोल्डर में रखना चाहिए।

image.png

यदि आपके कंप्यूटर की कॉन्फ़िगरेशन सामान्य है, तो आप Flux-fp8 लाइट संस्करण डाउनलोड कर सकते हैं, जो केवल 11.9GB है: https://huggingface.co/Kijai/flux-fp8/blob/main/flux1-dev-fp8.safetensors

VAE अभी भी सामान्य ae.sft है।

image.png

हमारे पास बड़े मॉडल और VAE के अलावा Clip मॉडल भी डाउनलोड करने की आवश्यकता है: https://huggingface.co/comfyanonymous/flux_text_encoders/tree/main

यह वास्तव में SD3 का Clip मॉडल है, कॉन्फ़िगर करते समय हम fp16 चुनते हैं, यदि कॉन्फ़िगरेशन सामान्य है तो हम fp8 चुनते हैं, clip_l को डाउनलोड करना अनिवार्य है।

डाउनलोड के बाद, हम इसे: ComfyUI\models\clip इस फ़ोल्डर में रखते हैं।

image.png

उपरोक्त बड़े मॉडल, VAE, और Clip को स्थापित करने के बाद, हम अपने वर्कफ़्लो को चलाने के लिए तैयार हैं, आधिकारिक वेबसाइट पर एक सरल ComfyUI वर्कफ़्लो प्रदान किया गया है: https://comfyanonymous.github.io/ComfyUI_examples/flux/

हम आधिकारिक वेबसाइट द्वारा प्रदान की गई छवि को सहेजते हैं।

image.png

फिर हम छवि को ComfyUI में खींचते हैं, अगर आपको इतना परेशानी नहीं है, तो आप हमारे समूह में शामिल होकर सीधे वर्कफ़्लो प्राप्त कर सकते हैं।

वर्कफ़्लो में प्रवेश करते समय, हम सुनिश्चित करते हैं कि मॉडल लोडिंग में कोई समस्या नहीं है, फिर हम कतार में शामिल होने के लिए क्लिक कर सकते हैं और उत्पन्न होने की प्रतीक्षा कर सकते हैं।

image.png

जनित चित्र प्रभाव

प्रॉम्प्ट 1: एक बोतल जिसमें एक इंद्रधनुष आकाशगंगा है, एक आधुनिक रसोई में एक लकड़ी की मेज पर।

image.png

प्रॉम्प्ट 2: एक पुराने कक्षा में एक काले बोर्ड की तस्वीर। काले बोर्ड पर चाक से लिखा है "चलो कुछ बहुत सुंदर चीजें साथ में बनाते हैं" और शब्दों के बाद एक लाल चाक का दिल है। सूरज की रोशनी खिड़की से आ रही है।

image.png

प्रॉम्प्ट 3: एक फिल्मी फोटो जिसमें तीन महिलाएं शहर के बीचोंबीच हैं, वे कैमरे की ओर अपने हाथ उठाए हुए हैं।

image.png

प्रॉम्प्ट 4: एक फूल पर एक लघु गांव की मैक्रो फोटोग्राफी।

image.png

FP8 संस्करण, प्रॉम्प्ट 5: एक आदमी की आंख और चेहरे की क्लोज़-अप फुजिफिल्म फोटो।

image.png

प्रॉम्प्ट 6: खूबसूरत एनीमे कला, एक प्यारी एनीमे लड़की रात की अंधेरे में अकेली खड़ी है, जो एक बड़े काले रेनकोट में है और एक छोटे बैग के साथ है। वह एक काले छाते को पकड़े हुए है, जिसमें रंगीन LED छिपी हुई हैं जो उस पर चमकती हैं, उसके चारों ओर छोटे गुलाब की पंखुड़ियाँ उड़ रही हैं, एनीमे स्क्रीनकैप शैली, लाल आंखें, मध्यम बाल।

image.png

निष्कर्ष

कुल मिलाकर, परीक्षण करने पर परिणाम बहुत अच्छे हैं, FLUX SD3 से बेहतर है।

  1. हाथों का निर्माण काफी स्थिर है, हाथ-पैरों में विकृति कम होती है। 

  2. डिस्टिल्ड संस्करण की चित्रण गति तेज है, 30 सेकंड के भीतर पूरा हो जाता है। Dev संस्करण का चित्रण थोड़ा अधिक समय लेता है लेकिन चित्रण की गुणवत्ता बेहतर है।

  3. मॉडल की संगतता मजबूत है: चाहे वह एनीमे, मानव आकृति, यथार्थवादी, या दृश्य शैली हो, सभी का प्रभाव अच्छा है।  

----------------------------------------------------------------------------------------

स्टेशन मास्टर सामग्री AI ट्यूटोरियल स्टेशन मास्टर होमपेज का AI चित्रण ट्यूटोरियल प्लेटफ़ॉर्म है।

विशाल AI मुफ्त ट्यूटोरियल, निरंतर अपडेट सामग्री।

यदि आप अधिक AI चित्रण ट्यूटोरियल सीखना चाहते हैं, तो कृपया स्टेशन मास्टर सामग्री AI ट्यूटोरियल वेबसाइट पर जाएँ:

https://aisc.chinaz.com/jiaocheng/