O Flux recentemente recebeu muitos elogios de entusiastas de modelos, com qualidade de imagem superior à do SD3 e MJ. Muitos dizem que o Flux é o SD3 que todos desejavam, então fiquei muito curioso sobre a capacidade do FLux e, de quebra, compartilho o processo de instalação com vocês.
Imagem de referência do site:
Página inicial do site Flux: https://blackforestlabs.ai/
A startup de inteligência artificial Black Forest Labs lançou sua primeira suíte de modelos de IA de texto para imagem, FLUX.1. Esta empresa sediada na Alemanha foi fundada por pesquisadores que desenvolveram o Stable Diffusion, com o objetivo de criar IA generativa avançada para imagens e vídeos.
O modelo é dividido em três versões: Pro, Dev e Schnell.
Os gráficos da Black Forest afirmam que seus modelos Pro e Dev são os melhores geradores de imagens até hoje, enquanto o Schnell, com recursos mais limitados, se situa entre o Midjourney v5 e o Ideogram.
Descrição das três versões:
Pro: A versão com melhor resultado, mas de código fechado e com API paga.
Dev: Versão de código aberto, mas não comercial. Requer pelo menos 24 GB de VRAM para funcionar.
Schnell: Versão de código aberto e comercial.
Se você quiser experimentar online, há sites disponíveis:
Schnell: https://replicate.com/black-forest-labs/flux-schnell
Dev: https://replicate.com/black-forest-labs/flux-dev
Pro: https://replicate.com/black-forest-labs/flux-pro
Implementação Local
A versão mais recente do ComfyUI já é compatível com o modelo FLux. Basta atualizar o núcleo para a versão mais recente para experimentar.
Portanto, primeiro atualizaremos o ComfyUI.
Se você estiver usando o pacote integrado oficial do ComfyUI, clique aqui para atualizar.
Se você estiver usando o iniciador da Akiha, atualize o núcleo conforme o exemplo na imagem abaixo.
Para quem tem pouca memória de vídeo, a execução local provavelmente será difícil. Meu computador tem uma configuração razoável, então vou experimentar a versão Schnell.
Download do modelo grande: https://huggingface.co/black-forest-labs/FLUX.1-schnell/tree/main
Este link fornece um modelo grande de 23,8 GB e um modelo VAE de 335 MB. Precisamos baixar os dois.
Após o download, coloque o modelo grande na pasta: ComfyUI/models/unet/.
O VAE deve ser colocado na pasta ComfyUI/models/vae/.
Se seu computador tiver configurações modestas, você pode baixar a versão simplificada Flux-fp8, com apenas 11,9 GB: https://huggingface.co/Kijai/flux-fp8/blob/main/flux1-dev-fp8.safetensors
O VAE continua sendo o ae.sft universal.
Além do modelo grande e do VAE, precisamos baixar o modelo Clip: https://huggingface.co/comfyanonymous/flux_text_encoders/tree/main
Este é na verdade o modelo Clip do SD3. Para configurações boas, escolha fp16; para configurações comuns, escolha fp8; o clip_l é obrigatório.
Após o download, coloque-o na pasta: ComfyUI\models\clip
Após a instalação do modelo grande, VAE e Clip, podemos executar nosso fluxo de trabalho. O site oficial fornece um fluxo de trabalho ComfyUI simplificado: https://comfyanonymous.github.io/ComfyUI_examples/flux/
Salve a imagem fornecida pelo site oficial.
Arraste a imagem para o ComfyUI. Se você não quiser fazer isso, pode entrar em nosso grupo de discussão para obter o fluxo de trabalho diretamente.
No fluxo de trabalho, certifique-se de que o modelo esteja carregado corretamente e clique em "Adicionar à fila" para aguardar a geração.
Resultado da Geração de Imagens
Prompt 1: a bottle with a rainbow galaxy inside it on top of a wooden table on a table in the middle of a modern kitchen
Prompt 2: photograph of a black board in an old classroom. On the black board in chalk are the words “Lets make some really pretty stuff together” with a red chalk heart after the words. Sunlight is streaming in from the window
Prompt 3: filmic photo of a group of three women on a street downtown, they are holding their hands up the camera
Prompt 4: macro photography of a miniature little village on top of a flower
Versão FP8, Prompt 5: close up fujifilm photo of a mans eye and fac
Prompt 6: beautiful anime artwork, a cute anime girl standing alone at night darkness wearing an oversized black raincoat with a small bag. she is holding a black umbrella, the umbrella has multicolored LED hidden inside that shine down on her, small rose petals flutter through the air around her, anime screencap style, red eyes, medium hair
Conclusão
No geral, os testes mostraram resultados muito bons. O FLUX é superior ao SD3.
A geração de mãos é mais estável, com menos deformidades.
A versão destilada gera imagens rapidamente, em menos de 30 segundos. A versão Dev leva mais tempo, mas a qualidade da imagem é melhor.
Alta compatibilidade de modelos: os resultados são excelentes em estilos como anime, retratos, realismo e paisagens.
----------------------------------------------------------------------------------------
Tutoriais de IA do Site Master são uma plataforma de tutoriais de desenho de IA da Site Master Home
Grande quantidade de tutoriais de IA gratuitos, com conteúdo prático atualizado constantemente.
Para aprender mais sobre tutoriais de desenho de IA, visite o site de tutoriais de IA do Site Master: