Flux ha recibido recientemente excelentes críticas de muchos entusiastas de los modelos, superando en calidad de imagen a SD3 y MJ. Muchos dicen que Flux es el SD3 que todos esperaban, así que tengo mucha curiosidad por probar Flux y, de paso, compartiré el proceso de instalación con todos ustedes.
Imagen de referencia del sitio web:
Página principal de Flux: https://blackforestlabs.ai/
La startup de inteligencia artificial Black Forest Labs ha lanzado su primer modelo de inteligencia artificial de texto a imagen, FLUX.1. Esta empresa con sede en Alemania fue fundada por investigadores que desarrollaron Stable Diffusion, y tiene como objetivo crear inteligencia artificial generativa avanzada para imágenes y videos.
El modelo se divide en tres versiones: Pro, Dev y Schnell.
Los gráficos de Black Forest afirman que sus modelos Pro y Dev son los mejores generadores de imágenes hasta la fecha, mientras que su Schnell, con menos funciones, se ubica entre Midjourney v5 e Ideogram.
Descripción de las tres versiones:
Pro: Ofrece la mejor calidad, pero es de código cerrado y su API es de pago.
Dev: Es de código abierto pero no comercial, requiere al menos 24 GB de VRAM para funcionar.
Schnell: Es de código abierto y de uso comercial.
Si desea probarlo en línea, también hay sitios web disponibles:
Schnell: https://replicate.com/black-forest-labs/flux-schnell
Dev: https://replicate.com/black-forest-labs/flux-dev
Pro: https://replicate.com/black-forest-labs/flux-pro
Implementación local
La versión más reciente de ComfyUI ya es compatible con el modelo FLUX. Solo necesita actualizar el núcleo a la última versión para probarlo.
Así que primero actualicemos ComfyUI.
Si utiliza el paquete integrado oficial de ComfyUI, haga clic aquí para actualizar:
Si utiliza el lanzador de Akiha, actualice el núcleo siguiendo las instrucciones de la imagen:
Si tiene poca memoria de video, la ejecución local puede ser difícil. Mi computadora tiene una configuración decente, así que probaré la versión Schnell.
Descarga del modelo grande: https://huggingface.co/black-forest-labs/FLUX.1-schnell/tree/main
Este enlace proporciona un modelo grande de 23.8 GB y un modelo VAE de 335 MB. Necesitamos descargar ambos.
Una vez descargado, coloque el modelo grande en la carpeta: ComfyUI/models/unet/.
El VAE debe colocarse en la carpeta ComfyUI/models/vae/.
Si su computadora tiene una configuración modesta, puede descargar la versión simplificada Flux-fp8, que solo pesa 11.9 GB: https://huggingface.co/Kijai/flux-fp8/blob/main/flux1-dev-fp8.safetensors
El VAE sigue siendo el ae.sft general.
Además del modelo grande y el VAE, también necesitamos descargar el modelo CLIP: https://huggingface.co/comfyanonymous/flux_text_encoders/tree/main
Este es en realidad el modelo CLIP de SD3. Si su configuración es buena, seleccione fp16; si es modesta, seleccione fp8; clip_l es obligatorio.
Una vez descargado, colóquelo en la carpeta: ComfyUI\models\clip
Una vez instalados el modelo grande, el VAE y el CLIP, podemos ejecutar nuestro flujo de trabajo. El sitio web proporciona un flujo de trabajo ComfyUI sencillo: https://comfyanonymous.github.io/ComfyUI_examples/flux/
Guardemos la imagen proporcionada en el sitio web:
Luego arrastre la imagen a ComfyUI. Si no quiere complicarse, puede unirse a nuestro grupo de chat para obtener el flujo de trabajo directamente.
En el flujo de trabajo, asegúrese de que el modelo se cargue correctamente y haga clic en "Añadir a la cola" para esperar la generación.
Resultados de la generación de imágenes
Indicación 1: a bottle with a rainbow galaxy inside it on top of a wooden table on a table in the middle of a modern kitchen
Indicación 2: photograph of a black board in an old classroom. On the black board in chalk are the words “Lets make some really pretty stuff together” with a red chalk heart after the words. Sunlight is streaming in from the window
Indicación 3: filmic photo of a group of three women on a street downtown, they are holding their hands up the camera
Indicación 4: macro photography of a miniature little village on top of a flower
Versión FP8, Indicación 5: close up fujifilm photo of a mans eye and fac
Indicación 6: beautiful anime artwork, a cute anime girl standing alone at night darkness wearing an oversized black raincoat with a small bag. she is holding a black umbrella, the umbrella has multicolored LED hidden inside that shine down on her, small rose petals flutter through the air around her, anime screencap style, red eyes, medium hair
Conclusión
En general, las pruebas muestran que los resultados son muy buenos, FLUX es mejor que SD3.
La generación de manos es bastante estable, con pocas deformaciones.
La versión destilada genera imágenes rápidamente, en menos de 30 segundos. La versión Dev tarda más, pero la calidad de las imágenes es mejor.
Alta compatibilidad del modelo: los resultados son excelentes tanto para estilos de anime, retratos, realismo como paisajes.
----------------------------------------------------------------------------------------
Tutoriales de IA de recursos para webmasters, una plataforma de tutoriales de dibujo de IA de ChinaZ
Gran cantidad de tutoriales de IA gratuitos, con contenido práctico actualizado continuamente.
Para aprender más tutoriales de dibujo de IA, visite el sitio web de tutoriales de IA de recursos para webmasters: