SD3.5: Vergangenheit und Gegenwart
Im Juni veröffentlichte Stability AI Stable Diffusion 3 Medium. Nach der Veröffentlichung von FLUX wurde SD3 jedoch weitgehend aufgegeben, da es in vielerlei Hinsicht von FLUX übertroffen wurde und die ungünstigen Vertragsbedingungen von Stability AI zu einem starken Rückgang der Popularität von SD3 führten. Das Unternehmen hat aus den Fehlern gelernt und die Version 3.5 weiterentwickelt. Stability AI verspricht, dass SD3.5 ein für Entwickler und Kreative gleichermaßen zugängliches, hochmodernes und in den meisten Anwendungsfällen kostenloses Tool sein wird.
Modellmerkmale
Vor wenigen Stunden veröffentlichte Stability AI offiziell die „Large“-Version von Stable Diffusion 3.5.
Dieses Update weist zwei bemerkenswerte Merkmale auf:
① Verbesserte Vielfalt der Modell-Stile: Benutzer können durch Anpassung der Eingabeaufforderungen eine größere Bandbreite an Bildstilen abrufen.
② Reduzierte „AI-artige“ Textur der Bilder: Licht und Material wirken natürlicher, wodurch die generierten Bilder realistischer erscheinen.
Stability AI hat zwei Versionen veröffentlicht: Large und Large Turbo.
Eine Medium-Version soll laut Ankündigung am 29. Oktober veröffentlicht werden.
Beschreibung der beiden aktuellen Versionen:
Stable Diffusion 3.5 Large: Dieses Basismodell verfügt über 8 Milliarden Parameter, zeichnet sich durch hervorragende Qualität und schnelle Verarbeitung aus und ist das leistungsstärkste der Stable Diffusion-Reihe. Dieses Modell eignet sich hervorragend für professionelle Anwendungen mit 1 MP Auflösung.
Stable Diffusion 3.5 Large Turbo: Eine optimierte Version von Stable Diffusion 3.5 Large, die hochwertige Bilder mit hervorragender Geschwindigkeit in nur 4 Schritten generiert und somit deutlich schneller als Stable Diffusion 3.5 Large ist.
Die folgende Abbildung zeigt einen offiziellen Modellvergleich. Es ist ersichtlich, dass die Ästhetik nicht an FLUX 1 Dev heranreicht, die Einhaltung der Eingabeaufforderungen jedoch derzeit am besten ist.
Daher werden wir die Leistungsfähigkeit von SD3.5 testen und im Vergleich zu FLUX prüfen, ob es ein Comeback an die Spitze des KI-Bildgenerierungsbereichs schaffen kann.
Eine detailliertere Beschreibung finden Sie auf der offiziellen Seite: https://stability.ai/news/introducing-stable-diffusion-3-5
Online-Testversion
Large Online-Testversion: https://huggingface.co/spaces/stabilityai/stable-diffusion-3.5-large
Turbo Online-Testversion: https://huggingface.co/spaces/stabilityai/stable-diffusion-3.5-large-turbo
Modell-Download
Large Download: https://huggingface.co/stabilityai/stable-diffusion-3.5-large
Turbo Download: https://huggingface.co/stabilityai/stable-diffusion-3.5-large-turbo
Beim ersten Download müssen Sie Kontaktinformationen angeben.
Modell-Verwendung
Wir laden den vom Hersteller bereitgestellten Beispiel-Workflow und das Modell herunter. Das Modell wird im Ordner ComfyUI\models\checkpoints abgelegt.
Ziehen Sie den Workflow in ComfyUI. Installieren Sie fehlende Knoten, falls vorhanden. Benutzer, die bereits mit SD3 gearbeitet haben, sollten diese Knoten bereits installiert haben.
Wir müssen drei CLIP-Modelle laden. Benutzer, die diese nicht besitzen, können sie hier herunterladen: https://huggingface.co/stabilityai/stable-diffusion-3-medium/tree/main/text_encoders
Legen Sie die heruntergeladenen Modelle im Ordner ComfyUI\models\clip ab.
Für optimale Ergebnisse kann T5xxl durch die FP16-Version ersetzt werden.
Bildgenerierungsergebnisse
Die Bildgenerierung von SD3.5 beansprucht viel Arbeitsspeicher. Selbst mit 24 GB VRAM einer 4090 wird der Speicher schnell voll. Die Generierung eines Bildes mit 1024 x 1024 Pixel dauert etwa 40 Sekunden.
Zusammenfassung
Der obige Vergleich zeigt Vor- und Nachteile.
Bei SD3.5 gibt es immer noch Probleme mit den Händen von Personen. Das Entwicklungsteam ist sich dieser Probleme wahrscheinlich bewusst, daher ist das „Verstecken“ von Händen bei SD3.5 etwas ausgeprägter als bei FLUX.
Ein Vorteil von SD3.5 ist, dass die Bilder manchmal realistischer wirken. Die Darstellung von Haut bei FLUX wirkt oft fettig, während SD3.5 eine feinere und realistischere Darstellung bietet.
Bei langen Texten und der Einhaltung von Eingabeaufforderungen sind beide Modelle meiner Meinung nach vergleichbar.
In Bezug auf die Ästhetik ist SD3.5 manchmal besser.
In Bezug auf die Leistung ist SD3.5 langsamer als FLUX und hat einen höheren Speicherbedarf.
Da FLUX jedoch ein besser ausgebautes Ökosystem hat, dürfte SD3.5 FLUX kurzfristig nicht übertreffen.
------------------------------------------------------------------------------------------
Die Website „Station Master Material AI Tutorial“ ist eine Plattform für KI-Bildgenerierungs-Tutorials von Station Master Home.
Viele kostenlose KI-Tutorials, ständig aktualisierte Inhalte.
Weitere KI-Bildgenerierungs-Tutorials finden Sie auf der Website von Station Master Material AI Tutorial: