ComfyUI कार्यप्रवाह विश्लेषण: फोटो से चित्र में पुराने जमाने के चित्र

यह मामला हमारे पहले सीखे गए सभी विषयों को एकीकृत करता है, जो पुनरावलोकन और समझ को गहरा करने के लिए एक संपूर्ण मामले के रूप में बहुत उपयुक्त है।

जो साथी पहले के ट्यूटोरियल नहीं देख पाए हैं, वे वेबसाइट पर जाकर देख सकते हैं।

वेबसाइट लिंक：https://aisc.chinaz.com/jiaocheng/

_x0000_i1026

यह कार्यप्रवाह comfyui का उपयोग करके फोटो को पुराने एनीमे शैली की छवि में बदलता है। इस कार्यप्रवाह में विभिन्न नोड्स और उनके कार्यों का विस्तृत विश्लेषण इस प्रकार है：

नोड विश्लेषण

1. छवि लोडिंग और पूर्व-प्रसंस्करण：

LoadImage (id: 13): निर्दिष्ट URL से इनपुट छवि लोड करें।

DF_Get_image_size (id: 15): लोड की गई छवि की चौड़ाई और ऊँचाई प्राप्त करें।

EmptyLatentImage (id: 5): निकासी आयामों के साथ एक खाली संभावित छवि बनाएं।

2. ControlNet लोडर और पूर्व-प्रसंस्करण：

ControlNetLoader (id: 28): रेखाचित्र के लिए ControlNet मॉडल लोड करें (control_v11p_sd15_lineart.pth)।

ControlNetLoader (id: 30): मुद्रा पहचान के लिए ControlNet मॉडल लोड करें (control_v11p_sd15_openpose.pth)।

ControlNetLoader (id: 27): गहराई पहचान के लिए ControlNet मॉडल लोड करें (control_v11f1p_sd15_depth.pth)।

Zoe_DepthAnythingPreprocessor (id: 40): गहराई जानकारी उत्पन्न करने के लिए छवि को संसाधित करें।

Inference_Core_LineArtPreprocessor (id: 42): रेखाचित्र जानकारी उत्पन्न करने के लिए छवि को संसाधित करें।

OpenposePreprocessor (id: 39): मुद्रा कुंजी बिंदुओं उत्पन्न करने के लिए छवि को संसाधित करें।

3. शर्तें लागू करना और संयोजन करना：

ControlNetApply (id: 26, 29, 31): छवि पर ControlNet शर्तें लागू करें, गहराई, रेखाचित्र और मुद्रा जानकारी को मिलाकर।

ConditioningCombine (id: 37): विभिन्न शर्तों की जानकारी को मिलाएं।

4. पाठ एन्कोडिंग：

CLIPTextEncode (id: 6): सकारात्मक वर्णनात्मक पाठ को एन्कोड करें, जैसे “beautiful scenery nature glass bottle landscape, purple galaxy bottle”。

CLIPTextEncode (id: 7): नकारात्मक वर्णनात्मक पाठ को एन्कोड करें, जैसे “Easy Negative, worst quality, low quality”等。

CLIPTextEncode (id: 34): अतिरिक्त वर्णनात्मक पाठ को एन्कोड करें, जैसे “official art, context art, retro anime, complex background, blurry background, depth of field”。

5. मॉडल लोडिंग और सैंपलिंग：

CheckpointLoaderSimple (id: 4): मुख्य जनरेटिव मॉडल लोड करें (AWPainting(1.4))।

LoraLoader (id: 10, 16): विशिष्ट शैली के समायोजन के लिए Lora मॉडल लोड करें (जैसे “80'sFusion(V2.0)” और “Retro Anime(1.0)”)।

KSampler (id: 3): संभावित छवि के सैंपलिंग के लिए KSampler का उपयोग करें, मॉडल, सकारात्मक और नकारात्मक शर्तों और संभावित छवि को मिलाकर।

VAEDecode (id: 8): सैंपल की गई संभावित छवि को अंतिम छवि में डिकोड करें।

6. छवि सहेजना：

SaveImage (id: 9): उत्पन्न छवि को सहेजें।

उपयोग निर्देश

चूंकि ComfyUI कार्यप्रवाह काफी दोहरावदार है, मैं यहां सीधे कार्यप्रवाह प्रदान कर रहा हूं और मुख्य बिंदुओं को समझाने में मदद कर रहा हूं। जो इस कार्यप्रवाह की आवश्यकता है, वे नीचे दिए गए QR कोड को स्कैन करके समूह में शामिल हो सकते हैं, अगर किसी को कोई बात समझ में नहीं आती है, तो वे भी समूह में चर्चा कर सकते हैं।

पहली बार कार्यप्रवाह का उपयोग करते समय यदि कोई त्रुटि आती है जिसमें लापता नोड स्थापित करने का संकेत होता है, तो हम प्रबंधक में लापता नोड को स्थापित कर सकते हैं।

Lora लोड करना

बड़े मॉडल को दो Lora से जोड़ना।

प्रतिपुष्टि लेबल

यदि WD14 प्रतिपुष्टि संकेतों के बिना साथी हैं, तो वे प्रबंधक में WD की खोज करके स्थापित कर सकते हैं, CLIP पाठ एन्कोडिंग को पाठ इनपुट के रूप में बदलना होगा ताकि WD द्वारा उत्पन्न की गई कुंजीशब्दों से जोड़ा जा सके।

ControlNet नियंत्रण

यहां तीन controlnet को श्रृंखलाबद्ध किया गया है, जो हैं, गहराई चित्र, रेखाचित्र, और मुद्रा नियंत्रण।

छवि की चौड़ाई और ऊँचाई प्राप्त करना

संकेत शब्दों का संयोजन

चूंकि हमारे Lora मॉडल को कुछ ट्रिगर शब्दों की आवश्यकता होती है, लेकिन पहले का पाठ एन्कोडर पहले से ही WD से जुड़ा हुआ है, इसलिए हमें केवल एक पाठ एन्कोडर की प्रतिलिपि बनानी होगी और WD संकेत शब्दों के पाठ एन्कोडर को मिलाना होगा। अंत में, संयोजित शर्त को पहले ControlNet आवेदन से जोड़ना होगा।

कार्यप्रवाह का प्रभाव

इस कार्यप्रवाह के मुख्य चरण हैं: छवि को लोड करना और पूर्व-प्रसंस्करण करना, विभिन्न ControlNet मॉडलों को लागू करना ताकि सहायक जानकारी (जैसे गहराई, रेखाचित्र और मुद्रा) उत्पन्न हो सके, फिर इन जानकारियों और पाठ वर्णन को मिलाकर छवि उत्पन्न करना, अंत में उत्पन्न पुराने एनीमे शैली की छवि को डिकोड और सहेजना। जो इस कार्यप्रवाह की आवश्यकता है, वे नीचे दिए गए QR कोड को स्कैन करके समूह में शामिल हो सकते हैं।

------------------------------------------------------------------------------------------

वेबसाइट सामग्री AI ट्यूटोरियल वेबसाइट है जो वेबमास्टर होम के तहत आती है

विशाल AI मुफ्त ट्यूटोरियल, लगातार अद्यतन सामग्री

अधिक AI चित्रण ट्यूटोरियल को गहराई से सीखने के लिए, कृपया वेबमास्टर सामग्री AI ट्यूटोरियल वेबसाइट पर जाएं：

https://aisc.chinaz.com/jiaocheng/

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

AI Brand Monitoring Tool

AI Search Visibility Checker

GEO Services​

AI Model Compatibility Checker

AI Deployment Calculator

ComfyUI कार्यप्रवाह विश्लेषण: फोटो से चित्र में पुराने जमाने के चित्र

站长素材

यह लेख AIbase दैनिक से है

संबंधित AI समाचार अनुशंसाएँ

«डे ज़» के निर्माता ने AI के डर को पहले गूगल और विकिपीडिया के डर के समान बताया

क्वालकॉम डेटा सेंटर में प्रवेश करता है! AI200/AI250 चिप के साथ नेविडिया के खिलाफ बृहत वितरण, एक दिन में 20% बढ़ी शेयर की कीमत

निवीडिया एआई केंद्र के क्रांतिकारी डिज़ाइन पेश करता है, उच्च कार्यक्षमता गणना में सहायता करता है

गूगल ने AI मार्केटिंग टूल पॉमेली लॉन्च किया: केवल वेबसाइट के पते के साथ ब्रांड कंटेंट स्वचालित रूप से बनाएं

अमेरिकी स senाटर ने कम उम्र के लोगों के AI चैटबॉट का उपयोग रोकने का प्रस्ताव दिया

हुआंग रेन्यू ने AI बुलबुला सिद्धांत को खंडित किया, नवीनतम चिप्स ने 50 अरब डॉलर की आय के लिए अपेक्षा की