Análise do Fluxo de Trabalho do ComfyUI: Transformando Fotos em Retratos Retro

Este caso integra todo o conteúdo que aprendemos anteriormente, sendo ideal para revisão e aprofundamento como um estudo de caso abrangente.

Para aqueles que não viram os tutoriais anteriores, podem acessá-los no site de tutoriais de IA da 站长素材, ok?

Link do site: https://aisc.chinaz.com/jiaocheng/

_x0000_i1026

Este fluxo de trabalho usa o ComfyUI para converter fotos em imagens de estilo anime retrô. Abaixo está uma análise detalhada de cada nó neste fluxo de trabalho e suas funções:

Análise dos Nós

1. Carregamento e Pré-processamento da Imagem:

LoadImage (id: 13): Carrega a imagem de entrada do URL especificado.

DF_Get_image_size (id: 15): Obtém a largura e a altura da imagem carregada.

EmptyLatentImage (id: 5): Cria uma imagem latente vazia com as dimensões extraídas.

2. Carregador e Pré-processador do ControlNet:

ControlNetLoader (id: 28): Carrega o modelo ControlNet para arte em linha (control_v11p_sd15_lineart.pth).

ControlNetLoader (id: 30): Carrega o modelo ControlNet para detecção de pose (control_v11p_sd15_openpose.pth).

ControlNetLoader (id: 27): Carrega o modelo ControlNet para detecção de profundidade (control_v11f1p_sd15_depth.pth).

Zoe_DepthAnythingPreprocessor (id: 40): Processa a imagem para gerar informações de profundidade.

Inference_Core_LineArtPreprocessor (id: 42): Processa a imagem para gerar informações de arte em linha.

OpenposePreprocessor (id: 39): Processa a imagem para gerar pontos-chave de pose.

3. Aplicação e Combinação de Condições:

ControlNetApply (id: 26, 29, 31): Aplica as condições ControlNet à imagem, combinando informações de profundidade, arte em linha e pose.

ConditioningCombine (id: 37): Combina as diferentes informações de condição.

4. Codificação de Texto:

CLIPTextEncode (id: 6): Codifica o texto de descrição positiva, como "paisagem natural bonita garrafa de vidro, garrafa de galáxia roxa".

CLIPTextEncode (id: 7): Codifica o texto de descrição negativa, como "Easy Negative, pior qualidade, baixa qualidade", etc.

CLIPTextEncode (id: 34): Codifica o texto de descrição adicional, como "arte oficial, arte contextual, anime retrô, fundo complexo, fundo desfocado, profundidade de campo".

5. Carregamento e Amostragem do Modelo:

CheckpointLoaderSimple (id: 4): Carrega o modelo de geração principal (AWPainting(1.4)).

LoraLoader (id: 10, 16): Carrega os modelos Lora para ajuste de estilo específico (como "80'sFusion(V2.0)" e "Retro Anime(1.0)").

KSampler (id: 3): Usa o KSampler para amostrar a imagem latente, combinando o modelo, as condições positivas e negativas e a imagem latente.

VAEDecode (id: 8): Decodifica a imagem latente amostrada em uma imagem final.

6. Salvamento da Imagem:

SaveImage (id: 9): Salva a imagem gerada.

Instruções de Uso

Como o fluxo de trabalho do ComfyUI é bastante complexo, estou fornecendo o fluxo de trabalho diretamente e explicando os pontos principais para ajudar a organizar a lógica. Para obter este fluxo de trabalho, você pode entrar em contato pelo QR code no final da página e participar do grupo. Se tiver alguma dúvida, também pode entrar em contato no grupo.

Na primeira utilização do fluxo de trabalho, pode haver um erro indicando a falta de instalação de alguns nós. Basta instalar os nós ausentes no gerenciador.

Carregamento do Lora

O modelo principal está conectado a dois modelos Lora.

Retroalimentação de Etiquetas

Usuários sem o WD14 para retroalimentação de prompts podem procurar e instalar o WD no gerenciador. A codificação de texto do CLIP precisa ser alterada para entrada de texto para se conectar com as palavras-chave retroalimentadas pelo WD.

Controle do ControlNet

Aqui, três ControlNets são usados em série: mapa de profundidade, arte em linha e controle de pose.

Obtendo a Largura e Altura da Imagem

Mesclando Prompts

Como nossos modelos Lora precisam de alguns termos de ativação, mas o codificador de texto anterior já está conectado ao WD, só podemos copiar outro codificador de texto e mesclar o codificador de texto com o prompt do WD. Finalmente, conectamos a condição mesclada ao primeiro aplicativo ControlNet.

Resultado do Fluxo de Trabalho

Os passos principais deste fluxo de trabalho são carregar e pré-processar a imagem, aplicar diferentes modelos ControlNet para gerar informações auxiliares (como profundidade, arte em linha e pose), e então combinar essas informações com a descrição de texto para gerar a imagem, finalmente decodificando e salvando a imagem gerada em estilo anime retrô. Para obter este fluxo de trabalho, você pode entrar em contato pelo QR code no final da página e participar do grupo.

------------------------------------------------------------------------------------------

站长素材 AI Tutorial é uma plataforma de tutoriais de desenho de IA da 站长之家.

Tutoriais de IA gratuitos em abundância, com conteúdo prático atualizado continuamente.

Para aprender mais tutoriais de desenho de IA, visite o site de tutoriais de IA da 站长素材:

https://aisc.chinaz.com/jiaocheng/

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

AI Brand Monitoring Tool

AI Search Visibility Checker

GEO Services​

AI Model Compatibility Checker

AI Deployment Calculator

Análise do Fluxo de Trabalho do ComfyUI: Transformando Fotos em Retratos Retro

站长素材

Este artigo é do AIbase Daily

Notícias de IA Relacionadas Recomendadas

20 mil dólares para um substituto de tarefas domésticas? O robô humanoide 1X Neo, financiado pela OpenAI, começa a pré-venda e entra nas casas norte-americanas no próximo ano

Hunyuan lança o primeiro podcast de IA interativo no país, os usuários podem fazer perguntas a qualquer momento

Amazon Cloud planeja investir mais 5 bilhões de dólares na Coreia do Sul para impulsionar a construção de centrais de dados de inteligência artificial

Diário de IA: Douyu lança sistema automático de dublagem em grupo; Adobe Firefly Image 5 atualizado significativamente; SoulX-Podcast, modelo de voz da Soul, é lançado

Qualcomm entra no mercado de data centers! Lança os chips AI200/AI250 com objetivo de enfrentar a NVIDIA, ações subiram mais de 20% em um dia

Magic Leap anuncia parceria reatada com o Google para desenvolver protótipos de óculos AR da próxima geração

Tsinghua e Kuaishou lançam um novo modelo de difusão SVG, eficiência de treinamento aumenta 6200%

NVIDIA lança design revolucionário para centro de dados de IA, impulsionando cálculo de alto desempenho

抖音副社長李亮：AI技術が偽情報の対策に役立つことで信頼できるプラットフォーム環境を構築する

Vice-presidente do Douyin, Li Liang, diz que a IA torna a difamação mais fácil e a plataforma está usando agentes inteligentes para combater falsas notícias