Este caso integra todo o conteúdo que aprendemos anteriormente, sendo ideal para revisão e aprofundamento como um estudo de caso abrangente.

Para aqueles que não viram os tutoriais anteriores, podem acessá-los no site de tutoriais de IA da 站长素材, ok?

Link do site: https://aisc.chinaz.com/jiaocheng/

_x0000_i1026

Este fluxo de trabalho usa o ComfyUI para converter fotos em imagens de estilo anime retrô. Abaixo está uma análise detalhada de cada nó neste fluxo de trabalho e suas funções:

Análise dos Nós

1. Carregamento e Pré-processamento da Imagem:

LoadImage (id: 13): Carrega a imagem de entrada do URL especificado.

DF_Get_image_size (id: 15): Obtém a largura e a altura da imagem carregada.

EmptyLatentImage (id: 5): Cria uma imagem latente vazia com as dimensões extraídas.

2. Carregador e Pré-processador do ControlNet:

ControlNetLoader (id: 28): Carrega o modelo ControlNet para arte em linha (control_v11p_sd15_lineart.pth).

ControlNetLoader (id: 30): Carrega o modelo ControlNet para detecção de pose (control_v11p_sd15_openpose.pth).

ControlNetLoader (id: 27): Carrega o modelo ControlNet para detecção de profundidade (control_v11f1p_sd15_depth.pth).

Zoe_DepthAnythingPreprocessor (id: 40): Processa a imagem para gerar informações de profundidade.

Inference_Core_LineArtPreprocessor (id: 42): Processa a imagem para gerar informações de arte em linha.

OpenposePreprocessor (id: 39): Processa a imagem para gerar pontos-chave de pose.

3. Aplicação e Combinação de Condições:

ControlNetApply (id: 26, 29, 31): Aplica as condições ControlNet à imagem, combinando informações de profundidade, arte em linha e pose.

ConditioningCombine (id: 37): Combina as diferentes informações de condição.

4. Codificação de Texto:

CLIPTextEncode (id: 6): Codifica o texto de descrição positiva, como "paisagem natural bonita garrafa de vidro, garrafa de galáxia roxa".

CLIPTextEncode (id: 7): Codifica o texto de descrição negativa, como "Easy Negative, pior qualidade, baixa qualidade", etc.

CLIPTextEncode (id: 34): Codifica o texto de descrição adicional, como "arte oficial, arte contextual, anime retrô, fundo complexo, fundo desfocado, profundidade de campo".

5. Carregamento e Amostragem do Modelo:

CheckpointLoaderSimple (id: 4): Carrega o modelo de geração principal (AWPainting(1.4)).

LoraLoader (id: 10, 16): Carrega os modelos Lora para ajuste de estilo específico (como "80'sFusion(V2.0)" e "Retro Anime(1.0)").

KSampler (id: 3): Usa o KSampler para amostrar a imagem latente, combinando o modelo, as condições positivas e negativas e a imagem latente.

VAEDecode (id: 8): Decodifica a imagem latente amostrada em uma imagem final.

6. Salvamento da Imagem:

SaveImage (id: 9): Salva a imagem gerada.

Instruções de Uso

Como o fluxo de trabalho do ComfyUI é bastante complexo, estou fornecendo o fluxo de trabalho diretamente e explicando os pontos principais para ajudar a organizar a lógica. Para obter este fluxo de trabalho, você pode entrar em contato pelo QR code no final da página e participar do grupo. Se tiver alguma dúvida, também pode entrar em contato no grupo.

image.png

Na primeira utilização do fluxo de trabalho, pode haver um erro indicando a falta de instalação de alguns nós. Basta instalar os nós ausentes no gerenciador.

image.png

Carregamento do Lora

O modelo principal está conectado a dois modelos Lora.

image.png

Retroalimentação de Etiquetas

Usuários sem o WD14 para retroalimentação de prompts podem procurar e instalar o WD no gerenciador. A codificação de texto do CLIP precisa ser alterada para entrada de texto para se conectar com as palavras-chave retroalimentadas pelo WD.

image.png

Controle do ControlNet

Aqui, três ControlNets são usados em série: mapa de profundidade, arte em linha e controle de pose.

image.png

Obtendo a Largura e Altura da Imagem

image.png

Mesclando Prompts

Como nossos modelos Lora precisam de alguns termos de ativação, mas o codificador de texto anterior já está conectado ao WD, só podemos copiar outro codificador de texto e mesclar o codificador de texto com o prompt do WD. Finalmente, conectamos a condição mesclada ao primeiro aplicativo ControlNet.

image.png

Resultado do Fluxo de Trabalho

image.png

image.png

Os passos principais deste fluxo de trabalho são carregar e pré-processar a imagem, aplicar diferentes modelos ControlNet para gerar informações auxiliares (como profundidade, arte em linha e pose), e então combinar essas informações com a descrição de texto para gerar a imagem, finalmente decodificando e salvando a imagem gerada em estilo anime retrô. Para obter este fluxo de trabalho, você pode entrar em contato pelo QR code no final da página e participar do grupo.

------------------------------------------------------------------------------------------

站长素材 AI Tutorial é uma plataforma de tutoriais de desenho de IA da 站长之家.

Tutoriais de IA gratuitos em abundância, com conteúdo prático atualizado continuamente.

Para aprender mais tutoriais de desenho de IA, visite o site de tutoriais de IA da 站长素材:

https://aisc.chinaz.com/jiaocheng/