Stable Diffusion 3 (SD3) est un puissant modèle de génération d'images à partir de texte, doté de 2 milliards de paramètres. Il est remarquable pour sa vitesse d'inférence élevée et ses excellents résultats de génération. Le 12 juin au soir, Stability AI, une plateforme de modèles open source renommée, a officiellement publié en open source les poids de SD3-M, offrant aux utilisateurs la possibilité de l'essayer gratuitement. (La vidéo de démonstration est disponible au-dessus de l'article !)

image.png

Accès au produit SD3-M :https://top.aibase.com/tool/stable-diffusion-3-medium

SD3-M présente un avantage significatif en termes de temps de génération d'images, ne nécessitant que 2 à 10 secondes environ. Ses exigences matérielles sont également relativement faibles, ce qui le rend compatible avec de nombreux appareils, tels que les PC, les téléphones portables et les tablettes. De plus, SD3-M a bénéficié d'optimisations matérielles spécifiques en collaboration avec Nvidia et AMD, notamment pour les GPU RTX, TensorRT, les derniers CPU et le MI-300X, permettant une amélioration des performances pouvant atteindre 50 %.

Ce modèle utilise l'architecture de transformateur de diffusion multimodale (MMDiT), offrant des améliorations significatives en termes de qualité d'image, de mise en page, de compréhension des invites textuelles complexes/de la sémantique et d'efficacité des ressources. SD3-M a été pré-entraîné sur un ensemble de données publiques et synthétiques comprenant 1 milliard d'images, et a ensuite été affiné sur 30 millions d'images pour des styles et domaines artistiques spécifiques, ainsi que sur 3 millions d'images de préférence, améliorant ainsi sa compréhension des invites textuelles et son intégration de texte dans les images.

La démonstration en ligne montre des résultats époustouflants. Des gratte-ciels imposants aux plages paisibles, des forêts tropicales aux restaurants rétro des années 1950, SD3-M fait preuve d'une remarquable capacité de génération d'images. L'essai gratuit en ligne offre aux utilisateurs des possibilités d'exploration infinies.

Il est important de noter que SD3-M est actuellement réservé à la recherche académique et ne peut pas être utilisé à des fins commerciales. Pour toute demande commerciale, les utilisateurs doivent contacter Stability AI pour obtenir une licence.

La publication en open source de SD3-M permet aux utilisateurs d'essayer gratuitement ce puissant modèle de génération d'images à partir de texte et d'explorer son potentiel d'application dans différents domaines. Nous espérons que cette initiative contribuera à créer davantage de possibilités et d'opportunités pour le développement du domaine de l'intelligence artificielle.

Adresse d'essai : https://huggingface.co/spaces/stabilityai/stable-diffusion-3-medium