Stability AI ha vuelto a superar las barreras tecnológicas con el lanzamiento de su nuevo modelo Stable Diffusion 3.5 Medium. Esta herramienta de dibujo con IA, dirigida al público general, no solo es completamente gratuita y de uso comercial abierto, sino que también logra un equilibrio perfecto entre alto rendimiento y accesibilidad.

Este modelo, basado en la arquitectura de transformador de difusión multimodal (MMDiT-X), con un diseño simplificado de 2.500 millones de parámetros, resuelve ingeniosamente el problema de los requisitos de hardware para el usuario medio. Con solo 9.9 GB de VRAM, puede ejecutarse sin problemas en la mayoría de las tarjetas gráficas de consumo, haciendo realidad la visión de que sea "utilizable para todos".

111.jpg

En cuanto a la innovación tecnológica, el modelo integra tres codificadores de texto preentrenados e introduce la técnica de normalización QK para mejorar la estabilidad del entrenamiento. Cabe destacar especialmente el diseño de módulos de atención dual en las primeras 12 capas de transformación, lo que permite al modelo mejorar significativamente la calidad de la imagen, el diseño y la comprensión de indicaciones complejas.

El proceso de entrenamiento del modelo combina datos sintéticos y datos públicos seleccionados, utilizando una estrategia de entrenamiento mixto con aumento de resolución progresivo, lo que garantiza la diversidad y la calidad de las imágenes generadas. En comparación con modelos medianos similares, presenta ventajas significativas en cuanto a la calidad y velocidad de generación de imágenes.

Sin embargo, los usuarios deben tener en cuenta algunos detalles: las indicaciones demasiado largas pueden provocar imperfecciones en los bordes de la imagen; se recomienda utilizar el método de muestreo con salto de capas para optimizar la integridad estructural de la imagen; y, debido a las diferencias en la distribución de los datos de entrenamiento, las mismas indicaciones pueden producir resultados creativos diferentes.

El lanzamiento de este modelo no solo proporciona a los creadores individuales y a las empresas emergentes una herramienta de creación de IA conveniente, sino que también refleja la determinación de Stability AI de promover la popularización de la tecnología de IA. Ya sea para la creación artística o el desarrollo educativo, ofrecerá posibilidades de creación con IA a un público mucho más amplio.

Enlace de descarga del modelo: https://huggingface.co/stabilityai/stable-diffusion-3.5-medium