FLUX.1: El nuevo modelo de IA de código abierto para la generación de imágenes más potente, ¡tutorial de implementación local!

站长素材

Publicado elNoticias de IA · 9 minutos de lectura · Aug 5, 2024

3.9k

Flux ha recibido recientemente excelentes críticas de muchos entusiastas de los modelos, superando en calidad de imagen a SD3 y MJ. Muchos dicen que Flux es el SD3 que todos esperaban, así que tengo mucha curiosidad por probar Flux y, de paso, compartiré el proceso de instalación con todos ustedes.

Imagen de referencia del sitio web:

Página principal de Flux: https://blackforestlabs.ai/

La startup de inteligencia artificial Black Forest Labs ha lanzado su primer modelo de inteligencia artificial de texto a imagen, FLUX.1. Esta empresa con sede en Alemania fue fundada por investigadores que desarrollaron Stable Diffusion, y tiene como objetivo crear inteligencia artificial generativa avanzada para imágenes y videos.

El modelo se divide en tres versiones: Pro, Dev y Schnell.

Los gráficos de Black Forest afirman que sus modelos Pro y Dev son los mejores generadores de imágenes hasta la fecha, mientras que su Schnell, con menos funciones, se ubica entre Midjourney v5 e Ideogram.

Descripción de las tres versiones:

Pro: Ofrece la mejor calidad, pero es de código cerrado y su API es de pago.
Dev: Es de código abierto pero no comercial, requiere al menos 24 GB de VRAM para funcionar.
Schnell: Es de código abierto y de uso comercial.

Si desea probarlo en línea, también hay sitios web disponibles:

Schnell: https://replicate.com/black-forest-labs/flux-schnell

Dev: https://replicate.com/black-forest-labs/flux-dev

Pro: https://replicate.com/black-forest-labs/flux-pro

Implementación local

La versión más reciente de ComfyUI ya es compatible con el modelo FLUX. Solo necesita actualizar el núcleo a la última versión para probarlo.

Así que primero actualicemos ComfyUI.

Si utiliza el paquete integrado oficial de ComfyUI, haga clic aquí para actualizar:

Si utiliza el lanzador de Akiha, actualice el núcleo siguiendo las instrucciones de la imagen:

Si tiene poca memoria de video, la ejecución local puede ser difícil. Mi computadora tiene una configuración decente, así que probaré la versión Schnell.

Descarga del modelo grande: https://huggingface.co/black-forest-labs/FLUX.1-schnell/tree/main

Este enlace proporciona un modelo grande de 23.8 GB y un modelo VAE de 335 MB. Necesitamos descargar ambos.

Una vez descargado, coloque el modelo grande en la carpeta: ComfyUI/models/unet/.
El VAE debe colocarse en la carpeta ComfyUI/models/vae/.

Si su computadora tiene una configuración modesta, puede descargar la versión simplificada Flux-fp8, que solo pesa 11.9 GB: https://huggingface.co/Kijai/flux-fp8/blob/main/flux1-dev-fp8.safetensors

El VAE sigue siendo el ae.sft general.

Además del modelo grande y el VAE, también necesitamos descargar el modelo CLIP: https://huggingface.co/comfyanonymous/flux_text_encoders/tree/main

Este es en realidad el modelo CLIP de SD3. Si su configuración es buena, seleccione fp16; si es modesta, seleccione fp8; clip_l es obligatorio.

Una vez descargado, colóquelo en la carpeta: ComfyUI\models\clip

Una vez instalados el modelo grande, el VAE y el CLIP, podemos ejecutar nuestro flujo de trabajo. El sitio web proporciona un flujo de trabajo ComfyUI sencillo: https://comfyanonymous.github.io/ComfyUI_examples/flux/

Guardemos la imagen proporcionada en el sitio web:

Luego arrastre la imagen a ComfyUI. Si no quiere complicarse, puede unirse a nuestro grupo de chat para obtener el flujo de trabajo directamente.

En el flujo de trabajo, asegúrese de que el modelo se cargue correctamente y haga clic en "Añadir a la cola" para esperar la generación.

Resultados de la generación de imágenes

Indicación 1: a bottle with a rainbow galaxy inside it on top of a wooden table on a table in the middle of a modern kitchen

Indicación 2: photograph of a black board in an old classroom. On the black board in chalk are the words “Lets make some really pretty stuff together” with a red chalk heart after the words. Sunlight is streaming in from the window

Indicación 3: filmic photo of a group of three women on a street downtown， they are holding their hands up the camera

Indicación 4: macro photography of a miniature little village on top of a flower

Versión FP8, Indicación 5: close up fujifilm photo of a mans eye and fac

Indicación 6: beautiful anime artwork， a cute anime girl standing alone at night darkness wearing an oversized black raincoat with a small bag. she is holding a black umbrella， the umbrella has multicolored LED hidden inside that shine down on her， small rose petals flutter through the air around her， anime screencap style， red eyes， medium hair

Conclusión

En general, las pruebas muestran que los resultados son muy buenos, FLUX es mejor que SD3.

La generación de manos es bastante estable, con pocas deformaciones.
La versión destilada genera imágenes rápidamente, en menos de 30 segundos. La versión Dev tarda más, pero la calidad de las imágenes es mejor.
Alta compatibilidad del modelo: los resultados son excelentes tanto para estilos de anime, retratos, realismo como paisajes.

----------------------------------------------------------------------------------------

Tutoriales de IA de recursos para webmasters, una plataforma de tutoriales de dibujo de IA de ChinaZ

Gran cantidad de tutoriales de IA gratuitos, con contenido práctico actualizado continuamente.

Para aprender más tutoriales de dibujo de IA, visite el sitio web de tutoriales de IA de recursos para webmasters:

https://aisc.chinaz.com/jiaocheng/

Amazon Cloud planea invertir otros 5.000 millones de dólares en Corea para impulsar la construcción de centros de datos de inteligencia artificial

Amazon AWS anunció que invertirá otros 5.000 millones de dólares en Corea durante los próximos seis años para ampliar los centros de datos de inteligencia artificial, y colaborará con el Grupo SK para construir una instalación grande en Ulsan. La inversión total en Corea alcanzará los 12.600 millones de dólares, lo que demuestra su importancia estratégica para el mercado coreano.

El padre de DayZ compara su temor actual a la inteligencia artificial con el pánico anterior hacia Google y Wikipedia

La rápida evolución de las tecnologías de IA está transformando la industria de los videojuegos. La IA generativa trae nuevas oportunidades y desafíos, y empresas como Microsoft y Amazon están reorientando sus recursos hacia aplicaciones de IA. Los desarrolladores de videojuegos tienen opiniones diferentes sobre esto, y el futuro de la industria sigue siendo incierto.

Vicepresidente de Douyin, Li Liang: La tecnología de IA ayuda a luchar contra la difusión de rumores y construir un entorno confiable para la plataforma

La televisión central informó sobre el problema de las noticias falsas creadas por la IA. Li Liang, vicepresidente de Douyin, respondió diciendo que la IA es una espada de doble filo: aunque es fácil propagar rumores, Douyin está utilizando la IA para combatirlos, desarrollando agentes inteligentes para buscar rápidamente información autoritativa y desmentir los rumores.

El ex responsable de productos de inteligencia artificial de CapCut de Bytedance, Liao Qian, inicia su propio emprendimiento y presenta un Agente multimodal para marketing

Liao Qian, ex responsable de productos de inteligencia artificial de CapCut de Bytedance, fundó la empresa 'Contexto extremo', dedicada al desarrollo de Agentes multimodales para marketing. Gracias a su amplia experiencia en el campo de AIGC, logró una ronda de financiación inicial de varios millones de dólares. Liao Qian trabajó previamente en Tencent y Bytedance, y desde 2019 se ha dedicado a la tecnología AIGC, atrayendo la atención del sector.

Google lanza una herramienta de marketing automático basada en IA llamada Pomelli, que genera contenido de marketing ingresando la URL del sitio web

Google Labs y DeepMind presentaron conjuntamente la herramienta de inteligencia artificial Pomelli, que está en prueba pública en Estados Unidos, Canadá, Australia y Nueva Zelanda. Esta herramienta está dirigida a pequeñas y medianas empresas, y mediante un análisis inteligente del contenido del sitio web, genera rápidamente campañas de marketing en redes sociales acordes al estilo de la marca, reduciendo así las barreras del marketing y permitiendo la creación de contenido profesional. Su función principal es construir el ADN comercial en tres pasos.

La reestructuración de OpenAI impulsa el valor de mercado de Microsoft a los 4 billones de dólares

OpenAI está pasando de ser una organización sin fines de lucro a una empresa comercial y busca activamente inversiones para acelerar su crecimiento. Este cambio estratégico ha fortalecido su competitividad en el mercado y ha tenido un impacto significativo en su socio Microsoft, ayudándole a superar el valor de mercado de 4 billones de dólares. La amplia aplicación de tecnologías como ChatGPT es el factor clave que lo impulsa.

¡Bajísima latencia! Cartesia presenta el motor de inteligencia artificial de voz Sonic-3: conversaciones extremadamente humanas con una latencia inferior a 100 milisegundos

La empresa Cartesia presenta el motor de inteligencia artificial de voz Sonic-3, que se autoproclama el modelo de conversación en tiempo real más rápido y natural del mundo. Logra interacciones casi sin latencia mediante una arquitectura innovadora de modelos de espacio de estados, capaz de simular emociones humanas, tonos y cambios de risa, mejorando significativamente la sensación de autenticidad en las conversaciones.

PayPal se une a OpenAI, ChatGPT se convierte en la primera plataforma de pago integrada

El 28 de octubre de 2025, PayPal y OpenAI anunciaron una colaboración para integrar ChatGPT en una billetera de pago, permitiendo a los usuarios realizar pagos en línea directamente desde ChatGPT, mejorando así la comodidad de las compras en línea. Esta noticia provocó un aumento del 15% en el precio de las acciones de PayPal antes de la apertura del mercado, con una reacción positiva del mercado. La colaboración está programada para comenzar el próximo año.

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

AI Brand Monitoring Tool

AI Search Visibility Checker

GEO Services​

AI Model Compatibility Checker

AI Deployment Calculator

FLUX.1: El nuevo modelo de IA de código abierto para la generación de imágenes más potente, ¡tutorial de implementación local!

站长素材

Implementación local

Resultados de la generación de imágenes

Conclusión

Este artículo proviene de AIbase Daily

Noticias de IA relacionadas recomendadas

Black Forest lanza el primer podcast de IA interactivo en China, los usuarios pueden hacer preguntas en cualquier momento

Amazon Cloud planea invertir otros 5.000 millones de dólares en Corea para impulsar la construcción de centros de datos de inteligencia artificial

El padre de DayZ compara su temor actual a la inteligencia artificial con el pánico anterior hacia Google y Wikipedia

Vicepresidente de Douyin, Li Liang: La tecnología de IA ayuda a luchar contra la difusión de rumores y construir un entorno confiable para la plataforma

El ex responsable de productos de inteligencia artificial de CapCut de Bytedance, Liao Qian, inicia su propio emprendimiento y presenta un Agente multimodal para marketing

Google lanza una herramienta de marketing de inteligencia artificial llamada Pomelli: solo se necesita una URL para generar automáticamente contenido de marca

Google lanza una herramienta de marketing automático basada en IA llamada Pomelli, que genera contenido de marketing ingresando la URL del sitio web

La reestructuración de OpenAI impulsa el valor de mercado de Microsoft a los 4 billones de dólares

¡Bajísima latencia! Cartesia presenta el motor de inteligencia artificial de voz Sonic-3: conversaciones extremadamente humanas con una latencia inferior a 100 milisegundos

PayPal se une a OpenAI, ChatGPT se convierte en la primera plataforma de pago integrada

Noticias de IA relacionadas recomendadas

Black Forest lanza el primer podcast de IA interactivo en China, los usuarios pueden hacer preguntas en cualquier momento

Amazon Cloud planea invertir otros 5.000 millones de dólares en Corea para impulsar la construcción de centros de datos de inteligencia artificial

El padre de DayZ compara su temor actual a la inteligencia artificial con el pánico anterior hacia Google y Wikipedia

Vicepresidente de Douyin, Li Liang: La tecnología de IA ayuda a luchar contra la difusión de rumores y construir un entorno confiable para la plataforma

El ex responsable de productos de inteligencia artificial de CapCut de Bytedance, Liao Qian, inicia su propio emprendimiento y presenta un Agente multimodal para marketing

Google lanza una herramienta de marketing de inteligencia artificial llamada Pomelli: solo se necesita una URL para generar automáticamente contenido de marca

Google lanza una herramienta de marketing automático basada en IA llamada Pomelli, que genera contenido de marketing ingresando la URL del sitio web

La reestructuración de OpenAI impulsa el valor de mercado de Microsoft a los 4 billones de dólares

¡Bajísima latencia! Cartesia presenta el motor de inteligencia artificial de voz Sonic-3: conversaciones extremadamente humanas con una latencia inferior a 100 milisegundos

PayPal se une a OpenAI, ChatGPT se convierte en la primera plataforma de pago integrada

GEO Services