Recientemente, el equipo creativo de Alibaba Mama lanzó FLUX.1-Turbo-Alpha, un modelo Lora de 8 pasos destilado basado en el modelo FLUX.1-dev.
Este modelo emplea un discriminador de múltiples cabezas, mejorando significativamente la calidad de la destilación y admite diversas aplicaciones relacionadas con FLUX, como la generación de imágenes a partir de texto y el control de reparación de la red.
FLUX.1-Turbo-Alpha se puede integrar directamente con el framework Diffusers. Los usuarios solo necesitan unas pocas líneas de código para cargar el modelo y generar las imágenes deseadas. Por ejemplo, puedes crear una escena divertida: un perezoso sonriente con una chaqueta de cuero, sombrero de vaquero, falda escocesa y lazo, parado frente a una furgoneta Volkswagen lisa con un paisaje urbano pintado. Con solo ajustar los parámetros, puedes generar imágenes de alta calidad con una resolución de 1024x1024.
Además, este modelo es compatible con ComfyUI, pudiéndose utilizar para flujos de trabajo rápidos de texto a imagen, o para lograr una generación más eficiente en la reparación de la red de control. Con esta tecnología, las imágenes generadas siguen fielmente la salida original, mejorando la experiencia creativa del usuario.
El proceso de entrenamiento de FLUX.1-Turbo-Alpha también es notable. El modelo se entrenó con más de 1 millón de imágenes de recursos de código abierto e internos, con una puntuación estética superior a 6.3 y una resolución superior a 800. El equipo utilizó un entrenamiento adversarial para mejorar la calidad de la imagen y añadió un diseño de múltiples cabezas para cada capa del transformador. Durante el entrenamiento, la escala de guía se fijó en 3.5, el desplazamiento de tiempo en 3, se utilizó precisión mixta bf16, con una tasa de aprendizaje de 2e-5, un tamaño de lote de 64 y un tamaño de imagen de 1024x1024.
El lanzamiento de FLUX.1-Turbo-Alpha marca otro gran avance de Alibaba Mama en el campo de la generación de imágenes, impulsando la popularización y aplicación de la inteligencia artificial.
Enlace al proyecto: https://huggingface.co/alimama-creative/FLUX.1-Turbo-Alpha
Puntos clave:
🌟 Este modelo se basa en FLUX.1-dev, utiliza destilación de 8 pasos y un discriminador de múltiples cabezas para mejorar la calidad de la generación de imágenes.
🖼️ Admite la generación de imágenes a partir de texto y el control de reparación de la red, permitiendo a los usuarios crear fácilmente diversas escenas divertidas.
📊 El proceso de entrenamiento utiliza entrenamiento adversarial, con más de 1 millón de imágenes de entrenamiento para garantizar una salida de alta calidad del modelo.