यह मामला हमारे पहले सीखे गए सभी विषयों को एकीकृत करता है, जो पुनरावलोकन और समझ को गहरा करने के लिए एक संपूर्ण मामले के रूप में बहुत उपयुक्त है।
जो साथी पहले के ट्यूटोरियल नहीं देख पाए हैं, वे वेबसाइट पर जाकर देख सकते हैं।
वेबसाइट लिंक:https://aisc.chinaz.com/jiaocheng/
यह कार्यप्रवाह comfyui का उपयोग करके फोटो को पुराने एनीमे शैली की छवि में बदलता है। इस कार्यप्रवाह में विभिन्न नोड्स और उनके कार्यों का विस्तृत विश्लेषण इस प्रकार है:
नोड विश्लेषण
1. छवि लोडिंग और पूर्व-प्रसंस्करण:
LoadImage (id: 13): निर्दिष्ट URL से इनपुट छवि लोड करें।
DF_Get_image_size (id: 15): लोड की गई छवि की चौड़ाई और ऊँचाई प्राप्त करें।
EmptyLatentImage (id: 5): निकासी आयामों के साथ एक खाली संभावित छवि बनाएं।
2. ControlNet लोडर और पूर्व-प्रसंस्करण:
ControlNetLoader (id: 28): रेखाचित्र के लिए ControlNet मॉडल लोड करें (control_v11p_sd15_lineart.pth)।
ControlNetLoader (id: 30): मुद्रा पहचान के लिए ControlNet मॉडल लोड करें (control_v11p_sd15_openpose.pth)।
ControlNetLoader (id: 27): गहराई पहचान के लिए ControlNet मॉडल लोड करें (control_v11f1p_sd15_depth.pth)।
Zoe_DepthAnythingPreprocessor (id: 40): गहराई जानकारी उत्पन्न करने के लिए छवि को संसाधित करें।
Inference_Core_LineArtPreprocessor (id: 42): रेखाचित्र जानकारी उत्पन्न करने के लिए छवि को संसाधित करें।
OpenposePreprocessor (id: 39): मुद्रा कुंजी बिंदुओं उत्पन्न करने के लिए छवि को संसाधित करें।
3. शर्तें लागू करना और संयोजन करना:
ControlNetApply (id: 26, 29, 31): छवि पर ControlNet शर्तें लागू करें, गहराई, रेखाचित्र और मुद्रा जानकारी को मिलाकर।
ConditioningCombine (id: 37): विभिन्न शर्तों की जानकारी को मिलाएं।
4. पाठ एन्कोडिंग:
CLIPTextEncode (id: 6): सकारात्मक वर्णनात्मक पाठ को एन्कोड करें, जैसे “beautiful scenery nature glass bottle landscape, purple galaxy bottle”。
CLIPTextEncode (id: 7): नकारात्मक वर्णनात्मक पाठ को एन्कोड करें, जैसे “Easy Negative, worst quality, low quality”等。
CLIPTextEncode (id: 34): अतिरिक्त वर्णनात्मक पाठ को एन्कोड करें, जैसे “official art, context art, retro anime, complex background, blurry background, depth of field”。
5. मॉडल लोडिंग और सैंपलिंग:
CheckpointLoaderSimple (id: 4): मुख्य जनरेटिव मॉडल लोड करें (AWPainting(1.4))।
LoraLoader (id: 10, 16): विशिष्ट शैली के समायोजन के लिए Lora मॉडल लोड करें (जैसे “80'sFusion(V2.0)” और “Retro Anime(1.0)”)।
KSampler (id: 3): संभावित छवि के सैंपलिंग के लिए KSampler का उपयोग करें, मॉडल, सकारात्मक और नकारात्मक शर्तों और संभावित छवि को मिलाकर।
VAEDecode (id: 8): सैंपल की गई संभावित छवि को अंतिम छवि में डिकोड करें।
6. छवि सहेजना:
SaveImage (id: 9): उत्पन्न छवि को सहेजें।
उपयोग निर्देश
चूंकि ComfyUI कार्यप्रवाह काफी दोहरावदार है, मैं यहां सीधे कार्यप्रवाह प्रदान कर रहा हूं और मुख्य बिंदुओं को समझाने में मदद कर रहा हूं। जो इस कार्यप्रवाह की आवश्यकता है, वे नीचे दिए गए QR कोड को स्कैन करके समूह में शामिल हो सकते हैं, अगर किसी को कोई बात समझ में नहीं आती है, तो वे भी समूह में चर्चा कर सकते हैं।
पहली बार कार्यप्रवाह का उपयोग करते समय यदि कोई त्रुटि आती है जिसमें लापता नोड स्थापित करने का संकेत होता है, तो हम प्रबंधक में लापता नोड को स्थापित कर सकते हैं।
Lora लोड करना
बड़े मॉडल को दो Lora से जोड़ना।
प्रतिपुष्टि लेबल
यदि WD14 प्रतिपुष्टि संकेतों के बिना साथी हैं, तो वे प्रबंधक में WD की खोज करके स्थापित कर सकते हैं, CLIP पाठ एन्कोडिंग को पाठ इनपुट के रूप में बदलना होगा ताकि WD द्वारा उत्पन्न की गई कुंजीशब्दों से जोड़ा जा सके।
ControlNet नियंत्रण
यहां तीन controlnet को श्रृंखलाबद्ध किया गया है, जो हैं, गहराई चित्र, रेखाचित्र, और मुद्रा नियंत्रण।
छवि की चौड़ाई और ऊँचाई प्राप्त करना
संकेत शब्दों का संयोजन
चूंकि हमारे Lora मॉडल को कुछ ट्रिगर शब्दों की आवश्यकता होती है, लेकिन पहले का पाठ एन्कोडर पहले से ही WD से जुड़ा हुआ है, इसलिए हमें केवल एक पाठ एन्कोडर की प्रतिलिपि बनानी होगी और WD संकेत शब्दों के पाठ एन्कोडर को मिलाना होगा। अंत में, संयोजित शर्त को पहले ControlNet आवेदन से जोड़ना होगा।
कार्यप्रवाह का प्रभाव
इस कार्यप्रवाह के मुख्य चरण हैं: छवि को लोड करना और पूर्व-प्रसंस्करण करना, विभिन्न ControlNet मॉडलों को लागू करना ताकि सहायक जानकारी (जैसे गहराई, रेखाचित्र और मुद्रा) उत्पन्न हो सके, फिर इन जानकारियों और पाठ वर्णन को मिलाकर छवि उत्पन्न करना, अंत में उत्पन्न पुराने एनीमे शैली की छवि को डिकोड और सहेजना। जो इस कार्यप्रवाह की आवश्यकता है, वे नीचे दिए गए QR कोड को स्कैन करके समूह में शामिल हो सकते हैं।
------------------------------------------------------------------------------------------
वेबसाइट सामग्री AI ट्यूटोरियल वेबसाइट है जो वेबमास्टर होम के तहत आती है
विशाल AI मुफ्त ट्यूटोरियल, लगातार अद्यतन सामग्री
अधिक AI चित्रण ट्यूटोरियल को गहराई से सीखने के लिए, कृपया वेबमास्टर सामग्री AI ट्यूटोरियल वेबसाइट पर जाएं: