Stable Diffusion 3 (abreviado como SD3) es un potente modelo de generación de imágenes a partir de texto, con 2 mil millones de parámetros, que destaca por su velocidad de inferencia eficiente y excelentes resultados de generación. El 12 de junio por la noche, la conocida plataforma de modelos de lenguaje abierto Stability AI lanzó oficialmente los pesos de SD3-M, ofreciendo a los usuarios la oportunidad de probarlo gratuitamente. ¡(El vídeo de prueba está arriba!)

image.png

Acceso al producto SD3-M:https://top.aibase.com/tool/stable-diffusion-3-medium

SD3-M ofrece una gran ventaja en el tiempo medio de generación de imágenes, necesitando solo entre 2 y 10 segundos aproximadamente. Además, sus requisitos de hardware son relativamente bajos, siendo compatible con PC, teléfonos móviles, tabletas y otros dispositivos. Asimismo, SD3-M ha sido optimizado en colaboración con Nvidia y AMD para hardware específico, incluyendo GPUs RTX, TensorRT, las CPU más recientes y MI-300X, con una mejora de rendimiento de hasta el 50%.

Este modelo emplea la arquitectura de transformador de difusión multimodal (MMDiT), logrando mejoras significativas en la calidad de la imagen, la composición, la comprensión de indicaciones/semántica complejas y la eficiencia de los recursos. SD3-M se entrenó con 1000 millones de imágenes de datos públicos y sintéticos, y se ajustó finamente con 30 millones de imágenes para estilos y campos artísticos específicos, además de 3 millones de imágenes de preferencia, lo que mejora su comprensión de las indicaciones de texto del usuario y la incrustación de texto en imágenes.

La demostración online muestra unos resultados impresionantes de SD3-M. Desde imponentes rascacielos hasta tranquilas playas, desde selvas tropicales hasta restaurantes clásicos de la década de 1950, SD3-M demuestra una excepcional capacidad de generación de imágenes. La prueba gratuita online ofrece a los usuarios infinitas posibilidades de exploración.

Cabe destacar que, actualmente, SD3-M solo se puede utilizar para investigación académica y no para aplicaciones comerciales. Para usos comerciales, los usuarios deben contactar con Stability AI para obtener una licencia.

La publicación de código abierto de SD3-M permite a los usuarios probar gratuitamente este potente modelo de generación de imágenes a partir de texto y explorar su potencial en diferentes campos. Esperamos que esta iniciativa impulse nuevas posibilidades y oportunidades en el campo de la inteligencia artificial.

Enlace de prueba: https://huggingface.co/spaces/stabilityai/stable-diffusion-3-medium