Stable Diffusion 3.5 Large es un modelo de transformador de difusión multimodal (MMDiT) basado en texto para generar imágenes, desarrollado por Stability AI. Este modelo presenta mejoras significativas en la calidad de la imagen, la composición, la comprensión de indicaciones complejas y la eficiencia de los recursos. Utiliza tres codificadores de texto preentrenados fijos y mejora la estabilidad del entrenamiento mediante la técnica de normalización QK. Además, el entrenamiento se basa en datos que incluyen datos sintéticos y datos públicos disponibles después de un proceso de filtrado. El modelo Stable Diffusion 3.5 Large se puede utilizar gratuitamente para investigación, fines no comerciales y para fines comerciales de organizaciones o particulares con ingresos anuales inferiores a 1 millón de dólares, siempre que se respete la licencia de la comunidad.