Das Alibaba Mama Kreativteam hat kürzlich FLUX.1-Turbo-Alpha veröffentlicht, ein 8-stufig destilliertes Lora-Modell, das auf dem FLUX.1-dev-Modell trainiert wurde.

Das Modell verwendet einen Mehrkopf-Diskriminator, der die Qualität der Destillation deutlich verbessert und verschiedene FLUX-bezogene Anwendungen wie Text-zu-Bild-Generierung und die Reparatur von Steuerungsnetzen unterstützt. Das Team empfiehlt, die Führungsskala auf 3,5 und die Lora-Skala auf 1 zu setzen. Zukünftig werden Versionen mit weniger Schritten veröffentlicht.

image.png

FLUX.1-Turbo-Alpha lässt sich direkt mit dem Diffusers-Framework verwenden. Benutzer können das Modell mit wenigen Codezeilen laden und die gewünschten Bilder generieren. Beispielsweise können Sie eine lustige Szene erstellen: Ein lächelndes Faultier trägt eine Lederjacke, einen Cowboyhut, einen karierten Rock und eine Schleife und steht vor einem glatten VW-Bus mit Stadtlandschaft. Durch einfaches Anpassen der Parameter können Sie hochauflösende Bilder mit 1024x1024 Pixeln generieren.

image.png

Darüber hinaus ist das Modell mit ComfyUI kompatibel und kann für schnelle Text-zu-Bild-Workflows oder für effizientere Ergebnisse bei der Reparatur von Steuerungsnetzen verwendet werden. Durch diese Technologie folgen die generierten Bilder dem ursprünglichen Output sehr gut und verbessern das kreative Erlebnis des Benutzers.

Der Trainingsprozess von FLUX.1-Turbo-Alpha ist ebenfalls bemerkenswert. Das Modell wurde mit über 1 Million Bildern aus Open-Source- und internen Ressourcen trainiert und erreicht eine ästhetische Bewertung von über 6,3. Die Auflösung aller Bilder liegt über 800 Pixeln. Das Team verwendete beim Training ein adversariales Training, um die Bildqualität zu verbessern, und fügte für jede Transformer-Schicht ein Mehrkopf-Design hinzu. Die Führungsskala wurde während des Trainings auf 3,5 festgelegt, der Zeitversatz auf 3. Es wurde gemischte Präzision (bf16) verwendet, mit einer Lernrate von 2e-5, einer Batch-Größe von 64 und einer Bildgröße von 1024x1024.

Die Einführung von FLUX.1-Turbo-Alpha markiert einen weiteren Durchbruch von Alibaba Mama im Bereich der Bildgenerierung und fördert die Verbreitung und Anwendung von künstlicher Intelligenz.

Projektseite: https://huggingface.co/alimama-creative/FLUX.1-Turbo-Alpha

Wichtigste Punkte:

🌟 Dieses Modell basiert auf FLUX.1-dev, verwendet 8-stufige Destillation und einen Mehrkopf-Diskriminator, um die Bildgenerierungsqualität zu verbessern.

🖼️ Unterstützt Text-zu-Bild-Generierung und die Reparatur von Steuerungsnetzen. Benutzer können einfach verschiedene lustige Szenen erstellen.

📊 Das Training verwendet ein adversariales Training mit über 1 Million Bildern, um eine hohe Ausgabequalität zu gewährleisten.