Stable Diffusion 3 de código abierto: llega el potente modelo de generación de imágenes a partir de texto SD3-M

AIbase

Publicado elNoticias de IA · 4 minutos de lectura · Jun 13, 2024

1.8k

Stable Diffusion 3 (abreviado como SD3) es un potente modelo de generación de imágenes a partir de texto, con 2 mil millones de parámetros, que destaca por su velocidad de inferencia eficiente y excelentes resultados de generación. El 12 de junio por la noche, la conocida plataforma de modelos de lenguaje abierto Stability AI lanzó oficialmente los pesos de SD3-M, ofreciendo a los usuarios la oportunidad de probarlo gratuitamente. ¡(El vídeo de prueba está arriba!)

Acceso al producto SD3-M:https://top.aibase.com/tool/stable-diffusion-3-medium

SD3-M ofrece una gran ventaja en el tiempo medio de generación de imágenes, necesitando solo entre 2 y 10 segundos aproximadamente. Además, sus requisitos de hardware son relativamente bajos, siendo compatible con PC, teléfonos móviles, tabletas y otros dispositivos. Asimismo, SD3-M ha sido optimizado en colaboración con Nvidia y AMD para hardware específico, incluyendo GPUs RTX, TensorRT, las CPU más recientes y MI-300X, con una mejora de rendimiento de hasta el 50%.

Este modelo emplea la arquitectura de transformador de difusión multimodal (MMDiT), logrando mejoras significativas en la calidad de la imagen, la composición, la comprensión de indicaciones/semántica complejas y la eficiencia de los recursos. SD3-M se entrenó con 1000 millones de imágenes de datos públicos y sintéticos, y se ajustó finamente con 30 millones de imágenes para estilos y campos artísticos específicos, además de 3 millones de imágenes de preferencia, lo que mejora su comprensión de las indicaciones de texto del usuario y la incrustación de texto en imágenes.

La demostración online muestra unos resultados impresionantes de SD3-M. Desde imponentes rascacielos hasta tranquilas playas, desde selvas tropicales hasta restaurantes clásicos de la década de 1950, SD3-M demuestra una excepcional capacidad de generación de imágenes. La prueba gratuita online ofrece a los usuarios infinitas posibilidades de exploración.

Cabe destacar que, actualmente, SD3-M solo se puede utilizar para investigación académica y no para aplicaciones comerciales. Para usos comerciales, los usuarios deben contactar con Stability AI para obtener una licencia.

La publicación de código abierto de SD3-M permite a los usuarios probar gratuitamente este potente modelo de generación de imágenes a partir de texto y explorar su potencial en diferentes campos. Esperamos que esta iniciativa impulse nuevas posibilidades y oportunidades en el campo de la inteligencia artificial.

Enlace de prueba: https://huggingface.co/spaces/stabilityai/stable-diffusion-3-medium

Noticias de IA

Este artículo proviene de AIbase Daily

¡Bienvenido a la columna [AI Diario]! Aquí está tu guía diaria para explorar el mundo de la inteligencia artificial. Todos los días te presentamos el contenido más destacado en el campo de la IA, centrándonos en los desarrolladores para ayudarte a comprender las tendencias tecnológicas y conocer las aplicaciones innovadoras de productos de IA.

—— Creado por el grupo AIbase Daily

Noticias de IA relacionadas recomendadas

Diario de IA: La versión actualizada de Yuanbao de Tencent permite buscar imágenes y videos con una sola frase; WeChat Pay MCP se lanza; Google presenta Veo 3 en todo el mundo

¡Bienvenido al programa 【Diario de IA】! Aquí está su guía para explorar el mundo de la inteligencia artificial cada día. Cada día, le presentamos los temas más destacados en el campo de la IA, enfocándonos en desarrolladores para ayudarle a comprender las tendencias tecnológicas y conocer las aplicaciones innovadoras de productos de IA. Productos de IA recientes, haga clic para obtener más información: https://top.aibase.com/1. Yuanbao de Tencent mejora nuevamente: Una sola frase para buscar, imágenes y videos aparecerán inmediatamente, permitiendo un acceso más intuitivo a la información. La función actualizada de Yuanbao de Tencent hace que el acceso a la información sea más intuitivo y eficiente. Solo necesita hacer una pregunta con una frase para obtener información textual y visual.

Jul 4, 2025

TikTok abre Trae-Agent para impulsar una nueva experiencia de desarrollo inteligente

Jul 4, 2025

Pago de WeChat MCP en línea: la perfecta combinación de IA y pagos, abriendo una nueva era comercial

Jul 4, 2025

Figma planea cotizarse en la Bolsa de Nueva York con una valoración de aproximadamente 20 mil millones de dólares, el futuro de la inteligencia artificial en el diseño es prometedor

Jul 4, 2025

Google presenta globalmente su nuevo modelo de generación de videos Veo 3

Google anunció oficialmente la puesta en marcha a nivel mundial de su último modelo de generación de videos Veo3. Esta noticia ha generado mucha expectativa entre los usuarios, y ahora Veo3 está disponible para los usuarios de Gemini en más de 159 países, ofreciendo una experiencia completamente nueva para crear videos. Las características del modelo de generación de videos Veo3 permiten a los usuarios generar videos de hasta ocho segundos a partir de simples instrucciones de texto. Según la descripción de Google, esta tecnología está diseñada especialmente para usuarios creativos, especialmente para los usuarios de redes sociales que cada vez demandan más contenido en forma de videos cortos.

Jul 4, 2025

Advertencia de Hitachi Energy: las fluctuaciones en la demanda eléctrica de los centros de inteligencia artificial podrían amenazar la estabilidad del suministro eléctrico mundial

Recientemente, el consejero delegado de Hitachi Energy, empresa fabricante líder de transformadores del mundo, Andreas Schierenbeck, señaló durante una entrevista con Financial Times que el aumento repentino de la demanda eléctrica por parte de grandes empresas tecnológicas al entrenar modelos de inteligencia artificial requiere que los gobiernos tomen medidas para limitar estas fluctuaciones y garantizar la estabilidad del suministro eléctrico. Nota: La imagen proviene de una fuente de licencia de Midjourney. Schierenbeck indicó que las fluctuaciones en la demanda eléctrica de los centros de datos de inteligencia artificial son extremadamente intensas,

Jul 4, 2025

Meta presenta un asistente de chat activo que hace que la IA vaya un paso adelante en la conversación

Recientemente, Meta está probando un nuevo tipo de asistente de chat que enviará mensajes activamente a los usuarios, en lugar de solo responder cuando el usuario inicia la conversación. Imagina que estás charlando con un amigo en Facebook Messenger o WhatsApp, y de repente, un asistente de chat de IA llamado "El maestro del magia cinematográfica" te envía un mensaje: ¡Espero que tengas un buen día! Me pregunto si has tenido alguna noticia recientemente.

Jul 4, 2025

Tencent Yuanbao se actualiza: una sola frase de búsqueda, imágenes y videos se presentan inmediatamente, la obtención de información es más intuitiva

El asistente inteligente Yuanbao anunció hoy una importante actualización en su función de búsqueda principal, lanzando una nueva característica llamada "con una sola frase puedes buscar más". Ahora, los usuarios solo necesitan hacer una pregunta sencilla y Yuanbao podrá coincidir inteligentemente y mostrar contenido de imágenes y canales de videos, haciendo que la obtención de información sea más rica e intuitiva que nunca. En el pasado, Yuanbao ya podía manejar fácilmente consultas sobre el clima, cotizaciones de acciones, búsquedas de ubicaciones y otras necesidades cotidianas. Esta actualización llevará la capacidad de búsqueda inteligente de Yuanbao a un nuevo nivel. Ya sea que desees aprender una nueva habilidad o resolver pequeños problemas de la vida diaria, Yuanbao podrá integrar texto

Jul 4, 2025

Cluely duplica sus ingresos anuales en una semana, alcanzando los 7 millones de dólares

La startup emergente Cluely, en pleno auge en Silicon Valley, anunció recientemente que sus ingresos anuales recurrentes (ARR) subieron rápidamente a unos 7 millones de dólares después del lanzamiento de su nuevo producto empresarial. Esta velocidad de crecimiento ha generado entusiasmo en el fundador Roy Lee, quien le dijo a TechCrunch: "Cada persona que tiene una reunión o entrevista está probando este producto." Cluely se dedica a utilizar la inteligencia artificial para analizar conversaciones en línea, proporcionando en tiempo real transcripciones de reuniones, información de fondo y sugerencias de preguntas, toda la información aparece silenciosamente en la pantalla del usuario.

Jul 4, 2025

JD Logistics presenta su camioneta ligera autónoma propia, JD Logistics VAN, con nivel de automatización L4 en carreteras públicas

En la reciente XVII Exposición Internacional de Tecnología y Equipo de Transporte, JD Logistics presentó por primera vez su producto de camioneta ligera autónoma desarrollado internamente: JD Logistics VAN. Esta camioneta ligera autónoma tiene un espacio de carga de 24 metros cúbicos, lo que la convierte en la camioneta ligera autónoma con mayor capacidad de carga en la industria logística actual, y podría reemplazar a los tradicionales camiones de 4.2 metros en环节 como el transporte de mercancías y el traslado entre estaciones. Según la información proporcionada, JD Logistics VAN tiene una autonomía de hasta 400 kilómetros cuando está completamente cargada y cuenta con la capacidad de automatización de nivel L4 en carreteras públicas. Esto significa que puede funcionar de manera autónoma.

Jul 4, 2025

Noticias de IA

IA Diario

Cronología de la IA

Al hardware

Últimos Casos

Colección de Imágenes

Colección de Videos

Colección de Audio

Colección de Contenido

Últimos Tutoriales

Ranking de Productos de IA

Ranking de Crecimiento de Tráfico de IA

Ranking de Descenso de Tráfico de IA

Ranking Semanal de IA

Estados Unidos

China

India

Brasil

Generación de Imágenes

Asistente Personal

Generación de Personajes

Generación de Videos

Ranking de Proyectos de IA

Ranking de Crecimiento de Proyectos de IA

Ranking de Desarrolladores de IA

Ranking de Organizaciones de IA

Deepseek

TTS

LLM

ChatGPT

Visión General

Stable Diffusion 3 de código abierto: llega el potente modelo de generación de imágenes a partir de texto SD3-M

AIbase

Este artículo proviene de AIbase Daily

Noticias de IA relacionadas recomendadas

Diario de IA: La versión actualizada de Yuanbao de Tencent permite buscar imágenes y videos con una sola frase; WeChat Pay MCP se lanza; Google presenta Veo 3 en todo el mundo

TikTok abre Trae-Agent para impulsar una nueva experiencia de desarrollo inteligente

Pago de WeChat MCP en línea: la perfecta combinación de IA y pagos, abriendo una nueva era comercial

Figma planea cotizarse en la Bolsa de Nueva York con una valoración de aproximadamente 20 mil millones de dólares, el futuro de la inteligencia artificial en el diseño es prometedor

Google presenta globalmente su nuevo modelo de generación de videos Veo 3

Advertencia de Hitachi Energy: las fluctuaciones en la demanda eléctrica de los centros de inteligencia artificial podrían amenazar la estabilidad del suministro eléctrico mundial

Meta presenta un asistente de chat activo que hace que la IA vaya un paso adelante en la conversación

Tencent Yuanbao se actualiza: una sola frase de búsqueda, imágenes y videos se presentan inmediatamente, la obtención de información es más intuitiva

Cluely duplica sus ingresos anuales en una semana, alcanzando los 7 millones de dólares

JD Logistics presenta su camioneta ligera autónoma propia, JD Logistics VAN, con nivel de automatización L4 en carreteras públicas