यह मामला हमारे पहले सीखे गए सभी विषयों को एकीकृत करता है, जो पुनरावलोकन और समझ को गहरा करने के लिए एक संपूर्ण मामले के रूप में बहुत उपयुक्त है।

जो साथी पहले के ट्यूटोरियल नहीं देख पाए हैं, वे वेबसाइट पर जाकर देख सकते हैं।

वेबसाइट लिंक:https://aisc.chinaz.com/jiaocheng/

_x0000_i1026

यह कार्यप्रवाह comfyui का उपयोग करके फोटो को पुराने एनीमे शैली की छवि में बदलता है। इस कार्यप्रवाह में विभिन्न नोड्स और उनके कार्यों का विस्तृत विश्लेषण इस प्रकार है:

नोड विश्लेषण

1. छवि लोडिंग और पूर्व-प्रसंस्करण:

LoadImage (id: 13):  निर्दिष्ट URL से इनपुट छवि लोड करें।

DF_Get_image_size (id: 15):  लोड की गई छवि की चौड़ाई और ऊँचाई प्राप्त करें।

EmptyLatentImage (id: 5):  निकासी आयामों के साथ एक खाली संभावित छवि बनाएं।

2. ControlNet लोडर और पूर्व-प्रसंस्करण:

ControlNetLoader (id: 28):  रेखाचित्र के लिए ControlNet मॉडल लोड करें (control_v11p_sd15_lineart.pth)।

ControlNetLoader (id: 30):  मुद्रा पहचान के लिए ControlNet मॉडल लोड करें (control_v11p_sd15_openpose.pth)।

ControlNetLoader (id: 27):  गहराई पहचान के लिए ControlNet मॉडल लोड करें (control_v11f1p_sd15_depth.pth)।

Zoe_DepthAnythingPreprocessor (id: 40):  गहराई जानकारी उत्पन्न करने के लिए छवि को संसाधित करें।

Inference_Core_LineArtPreprocessor (id: 42):  रेखाचित्र जानकारी उत्पन्न करने के लिए छवि को संसाधित करें।

OpenposePreprocessor (id: 39):  मुद्रा कुंजी बिंदुओं उत्पन्न करने के लिए छवि को संसाधित करें।

3. शर्तें लागू करना और संयोजन करना:

ControlNetApply (id: 26, 29, 31):  छवि पर ControlNet शर्तें लागू करें, गहराई, रेखाचित्र और मुद्रा जानकारी को मिलाकर।

ConditioningCombine (id: 37):  विभिन्न शर्तों की जानकारी को मिलाएं।

4. पाठ एन्कोडिंग:

CLIPTextEncode (id: 6):  सकारात्मक वर्णनात्मक पाठ को एन्कोड करें, जैसे “beautiful scenery nature glass bottle landscape, purple galaxy bottle”。

CLIPTextEncode (id: 7):  नकारात्मक वर्णनात्मक पाठ को एन्कोड करें, जैसे “Easy Negative, worst quality, low quality”等。

CLIPTextEncode (id: 34):  अतिरिक्त वर्णनात्मक पाठ को एन्कोड करें, जैसे “official art, context art, retro anime, complex background, blurry background, depth of field”。

5. मॉडल लोडिंग और सैंपलिंग:

CheckpointLoaderSimple (id: 4):  मुख्य जनरेटिव मॉडल लोड करें (AWPainting(1.4))।

LoraLoader (id: 10, 16):  विशिष्ट शैली के समायोजन के लिए Lora मॉडल लोड करें (जैसे “80'sFusion(V2.0)” और “Retro Anime(1.0)”)।

KSampler (id: 3):  संभावित छवि के सैंपलिंग के लिए KSampler का उपयोग करें, मॉडल, सकारात्मक और नकारात्मक शर्तों और संभावित छवि को मिलाकर।

VAEDecode (id: 8):  सैंपल की गई संभावित छवि को अंतिम छवि में डिकोड करें।

6. छवि सहेजना:

SaveImage (id: 9):  उत्पन्न छवि को सहेजें।

उपयोग निर्देश

चूंकि ComfyUI कार्यप्रवाह काफी दोहरावदार है, मैं यहां सीधे कार्यप्रवाह प्रदान कर रहा हूं और मुख्य बिंदुओं को समझाने में मदद कर रहा हूं। जो इस कार्यप्रवाह की आवश्यकता है, वे नीचे दिए गए QR कोड को स्कैन करके समूह में शामिल हो सकते हैं, अगर किसी को कोई बात समझ में नहीं आती है, तो वे भी समूह में चर्चा कर सकते हैं।

image.png

पहली बार कार्यप्रवाह का उपयोग करते समय यदि कोई त्रुटि आती है जिसमें लापता नोड स्थापित करने का संकेत होता है, तो हम प्रबंधक में लापता नोड को स्थापित कर सकते हैं।

image.png

Lora लोड करना

बड़े मॉडल को दो Lora से जोड़ना।

image.png

प्रतिपुष्टि लेबल

यदि WD14 प्रतिपुष्टि संकेतों के बिना साथी हैं, तो वे प्रबंधक में WD की खोज करके स्थापित कर सकते हैं, CLIP पाठ एन्कोडिंग को पाठ इनपुट के रूप में बदलना होगा ताकि WD द्वारा उत्पन्न की गई कुंजीशब्दों से जोड़ा जा सके।

image.png

ControlNet नियंत्रण

यहां तीन controlnet को श्रृंखलाबद्ध किया गया है, जो हैं, गहराई चित्र, रेखाचित्र, और मुद्रा नियंत्रण।

image.png

छवि की चौड़ाई और ऊँचाई प्राप्त करना

image.png

संकेत शब्दों का संयोजन

चूंकि हमारे Lora मॉडल को कुछ ट्रिगर शब्दों की आवश्यकता होती है, लेकिन पहले का पाठ एन्कोडर पहले से ही WD से जुड़ा हुआ है, इसलिए हमें केवल एक पाठ एन्कोडर की प्रतिलिपि बनानी होगी और WD संकेत शब्दों के पाठ एन्कोडर को मिलाना होगा। अंत में, संयोजित शर्त को पहले ControlNet आवेदन से जोड़ना होगा।

image.png

कार्यप्रवाह का प्रभाव

image.png

image.png

इस कार्यप्रवाह के मुख्य चरण हैं: छवि को लोड करना और पूर्व-प्रसंस्करण करना, विभिन्न ControlNet मॉडलों को लागू करना ताकि सहायक जानकारी (जैसे गहराई, रेखाचित्र और मुद्रा) उत्पन्न हो सके, फिर इन जानकारियों और पाठ वर्णन को मिलाकर छवि उत्पन्न करना, अंत में उत्पन्न पुराने एनीमे शैली की छवि को डिकोड और सहेजना। जो इस कार्यप्रवाह की आवश्यकता है, वे नीचे दिए गए QR कोड को स्कैन करके समूह में शामिल हो सकते हैं।

------------------------------------------------------------------------------------------

वेबसाइट सामग्री AI ट्यूटोरियल वेबसाइट है जो वेबमास्टर होम के तहत आती है

विशाल AI मुफ्त ट्यूटोरियल, लगातार अद्यतन सामग्री

अधिक AI चित्रण ट्यूटोरियल को गहराई से सीखने के लिए, कृपया वेबमास्टर सामग्री AI ट्यूटोरियल वेबसाइट पर जाएं:

https://aisc.chinaz.com/jiaocheng/