Stability AI a récemment publié un rapport technique détaillant Stable Diffusion 3 (SD3), son modèle de génération d'images le plus puissant à ce jour. SD3 surpasse tous les modèles, open source ou commerciaux, existants en termes de qualité de composition, d'esthétique et de compréhension des invites textuelles.
Le rapport présente une nouvelle architecture de transformateur de diffusion multimodale, améliorant la compréhension et l'orthographe du système. SD3 utilise une formule de flux correcteurs, rendant le processus d'entraînement plus direct et réduisant le nombre d'étapes d'échantillonnage.
Le rapport technique de Stability AI révèle la puissance et les détails de SD3, démontrant sa position de leader dans le domaine de la génération d'images.