Stable Cascade est un modèle de génération d'image à partir de texte basé sur l'architecture Würstchen. Contrairement à d'autres modèles, il utilise un espace latent plus petit pour l'entraînement et l'inférence, ce qui améliore considérablement la vitesse d'entraînement et d'inférence. Ce modèle peut fonctionner sur du matériel grand public, réduisant ainsi le seuil d'utilisation. Stable Cascade a démontré des performances exceptionnelles lors d'évaluations humaines, surpassant d'autres modèles tant en termes d'alignement des invites qu'en termes de qualité d'image. Globalement, il s'agit d'un modèle d'IA texte-image performant, facile à utiliser et efficace.