Stable Diffusion 3 officiellement open source : le modèle d'image à partir de texte SD3-M ultra-performant fait son apparition

AIbase

Publié leActualités IA · 4 minutes de lecture · Jun 13, 2024

1.8k

Stable Diffusion 3 (SD3) est un puissant modèle de génération d'images à partir de texte, doté de 2 milliards de paramètres. Il est remarquable pour sa vitesse d'inférence élevée et ses excellents résultats de génération. Le 12 juin au soir, Stability AI, une plateforme de modèles open source renommée, a officiellement publié en open source les poids de SD3-M, offrant aux utilisateurs la possibilité de l'essayer gratuitement. (La vidéo de démonstration est disponible au-dessus de l'article !)

Accès au produit SD3-M :https://top.aibase.com/tool/stable-diffusion-3-medium

SD3-M présente un avantage significatif en termes de temps de génération d'images, ne nécessitant que 2 à 10 secondes environ. Ses exigences matérielles sont également relativement faibles, ce qui le rend compatible avec de nombreux appareils, tels que les PC, les téléphones portables et les tablettes. De plus, SD3-M a bénéficié d'optimisations matérielles spécifiques en collaboration avec Nvidia et AMD, notamment pour les GPU RTX, TensorRT, les derniers CPU et le MI-300X, permettant une amélioration des performances pouvant atteindre 50 %.

Ce modèle utilise l'architecture de transformateur de diffusion multimodale (MMDiT), offrant des améliorations significatives en termes de qualité d'image, de mise en page, de compréhension des invites textuelles complexes/de la sémantique et d'efficacité des ressources. SD3-M a été pré-entraîné sur un ensemble de données publiques et synthétiques comprenant 1 milliard d'images, et a ensuite été affiné sur 30 millions d'images pour des styles et domaines artistiques spécifiques, ainsi que sur 3 millions d'images de préférence, améliorant ainsi sa compréhension des invites textuelles et son intégration de texte dans les images.

La démonstration en ligne montre des résultats époustouflants. Des gratte-ciels imposants aux plages paisibles, des forêts tropicales aux restaurants rétro des années 1950, SD3-M fait preuve d'une remarquable capacité de génération d'images. L'essai gratuit en ligne offre aux utilisateurs des possibilités d'exploration infinies.

Il est important de noter que SD3-M est actuellement réservé à la recherche académique et ne peut pas être utilisé à des fins commerciales. Pour toute demande commerciale, les utilisateurs doivent contacter Stability AI pour obtenir une licence.

La publication en open source de SD3-M permet aux utilisateurs d'essayer gratuitement ce puissant modèle de génération d'images à partir de texte et d'explorer son potentiel d'application dans différents domaines. Nous espérons que cette initiative contribuera à créer davantage de possibilités et d'opportunités pour le développement du domaine de l'intelligence artificielle.

Adresse d'essai : https://huggingface.co/spaces/stabilityai/stable-diffusion-3-medium

Actualités IA

Cet article provient d'AIbase Daily

Bienvenue dans la section [AI Quotidien] ! Voici votre guide pour explorer le monde de l'intelligence artificielle chaque jour. Chaque jour, nous vous présentons les points forts du domaine de l'IA, en mettant l'accent sur les développeurs, en vous aidant à comprendre les tendances technologiques et à découvrir des applications de produits IA innovantes.

—— Créé par le groupe AIbase Daily

Recommandations d'actualités IA connexes

20 000 dollars pour un double de ménage ? Le robot humanoïde 1X Neo soutenu par OpenAI commence à être vendu en pré-commande, il entrera dans les foyers américains en 2024

La société norvégienne de robots 1X lance son premier robot humanoïde destiné aux ménages, le Neo, au prix de 20 000 dollars, avec un abonnement mensuel de 499 dollars. Ce robot de 1,68 mètre est spécialement conçu pour des tâches ménagères comme laver la vaisselle ou ranger, et utilise un mode de collaboration entre l'IA et une assistance humaine à distance pour accomplir des tâches complexes.

Oct 29, 2025

210

Le père de DayZ compare sa peur actuelle envers l'IA à la panique précédente face à Google et Wikipedia

La technologie IA connaît un développement rapide, le secteur du jeu vidéo est en pleine transformation. L'IA générative apporte de nouvelles opportunités et défis, Microsoft, Amazon et d'autres entreprises réorientent leurs ressources vers les applications de l'IA. Les développeurs de jeux ont des avis divergents sur ce sujet, et le futur de l'industrie reste incertain.

Oct 29, 2025

100

NVIDIA présente un design révolutionnaire pour centres de données AI, favorisant le calcul à haute performance

Lors de la conférence GTC 2025, NVIDIA a présenté le « projet de conception Omniverse DSX », destiné spécifiquement aux centres de données AI de plusieurs milliards de watts. Ce projet est appelé l'« usine IA ». Cette solution repose sur le cadre Omniverse et prend en charge des configurations allant d'un à dix milliards de watts. Elle vise à former et à exécuter efficacement des modèles AI de grande taille, répondant ainsi à la croissance continue des besoins en calcul IA, représentant une avancée majeure dans les infrastructures d'intelligence artificielle.

Oct 29, 2025

200

Liao Qian, ancien responsable du produit AI de Jiansheng de Bytedance, lance son entreprise et lance un Agent multimodal de marketing

Liao Qian, ancien responsable du produit AI de Jiansheng de Bytedance, a fondé la société 'Contexte extrême', spécialisée dans le développement d'un Agent multimodal de marketing. Grâce à son expérience approfondie dans le domaine de l'AIGC, il a rapidement obtenu un financement initial de plusieurs millions de dollars. Liao Qian a travaillé chez Tencent et Bytedance, et s'est spécialisé dans les technologies AIGC depuis 2019, attirant ainsi l'attention de l'industrie.

Oct 29, 2025

Le modèle vocal SoulX-Podcast est officiellement lancé : une génération de podcasts sans interruption pendant 90 minutes, une révolution du vocal IA en phase d'upgrade

SoulX-Podcast, modèle vocal dédié aux podcasts, génère une voix haute fidélité. Supporte longs dialogues multilingues et multiclocuteurs avec stabilité sur 90+ minutes.....

Oct 29, 2025

Google lance un outil de marketing automatique par IA appelé Pomelli, qui génère du contenu de marketing en entrant l'URL d'un site web

Google Labs et DeepMind ont lancé ensemble l'outil d'IA Pomelli, en test public aux États-Unis, au Canada, en Australie et en Nouvelle-Zélande. Cet outil est destiné aux petites et moyennes entreprises, qui analyse intelligemment le contenu du site web pour créer rapidement des campagnes de marketing sur les réseaux sociaux conformes à l'identité de la marque, réduisant ainsi les barrières du marketing et permettant une création professionnelle de contenus. La fonction principale consiste en trois étapes pour construire l'ADN commercial.

Oct 29, 2025

190

Nvidia's Huang Renxun rejette la thèse de la bulle de l'IA, les nouvelles puces Nvidia devraient générer 500 milliards de dollars de chiffre d'affaires

Le PDG de Nvidia, Huang Renxun, a rejeté lors du congrès GTC à Washington la thèse d'une bulle sur le marché de l'intelligence artificielle. Il prévoit que les nouvelles puces Blackwell et Rubin généreront 500 milliards de dollars de revenus au cours des prochains trimestres, poussant l'entreprise dans une période de croissance sans précédent. C'est la première fois que Nvidia organise cet événement dans la capitale américaine.

Oct 29, 2025

Le redressement d'OpenAI pousse la valeur boursière de Microsoft à dépasser 4 000 milliards de dollars

OpenAI passe du non lucratif au commercial, cherchant activement des investissements pour accélérer sa croissance. Cette réorganisation renforce sa compétitivité sur le marché et a eu un impact significatif sur son partenaire Microsoft, qui a vu sa valeur boursière dépasser 4 000 milliards de dollars. L'utilisation généralisée des technologies comme ChatGPT est un facteur clé de cette poussée.

Oct 29, 2025

Adobe Firefly Image 5 : une mise à jour majeure : génération native de 4 millions de pixels, piste audio IA + modèles personnalisés, les créateurs entrent dans l'ère de la création artistique complète avec l'IA

Adobe lance le modèle de génération d'images IA professionnel Firefly Image5, marquant une transformation qualitative du ''suffisant'' vers le niveau professionnel. Les nouvelles fonctions comprennent une sortie native de 4 millions de pixels, un éditeur de commandes par couches, des modèles personnalisés de style artistique et une génération de musique d'accompagnement audio IA, fermant ainsi le cercle de la création artistique en IA pour les images, les vidéos et les audios, redéfinissant ainsi le flux de travail créatif.

Oct 29, 2025

180

Retard révolutionnaire ! Cartesia lance le moteur d'IA vocale Sonic-3 : une communication extrêmement réaliste avec un retard inférieur à 100 millisecondes

La société Cartesia lance le moteur d'IA vocale Sonic-3, prétendant être le modèle de conversation en temps réel le plus rapide et le plus naturel au monde. Il permet des interactions presque sans retard grâce à une nouvelle architecture de modèle à espace d'état, et est capable de simuler les émotions, le ton et les rires humains, améliorant ainsi significativement l'authenticité de la communication.

Oct 29, 2025

200

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

GEO Brand Visibility

AI Brand Monitoring Tool

AI Search Visibility Checker

GEO Promotion Link Detection

GEO Ranking Optimization System

GEO Services​

AI Model Compatibility Checker

AI Deployment Calculator

Stable Diffusion 3 officiellement open source : le modèle d'image à partir de texte SD3-M ultra-performant fait son apparition

AIbase

Cet article provient d'AIbase Daily

Recommandations d'actualités IA connexes

20 000 dollars pour un double de ménage ? Le robot humanoïde 1X Neo soutenu par OpenAI commence à être vendu en pré-commande, il entrera dans les foyers américains en 2024

Le père de DayZ compare sa peur actuelle envers l'IA à la panique précédente face à Google et Wikipedia

NVIDIA présente un design révolutionnaire pour centres de données AI, favorisant le calcul à haute performance

Liao Qian, ancien responsable du produit AI de Jiansheng de Bytedance, lance son entreprise et lance un Agent multimodal de marketing

Le modèle vocal SoulX-Podcast est officiellement lancé : une génération de podcasts sans interruption pendant 90 minutes, une révolution du vocal IA en phase d'upgrade

Google lance un outil de marketing automatique par IA appelé Pomelli, qui génère du contenu de marketing en entrant l'URL d'un site web

Nvidia's Huang Renxun rejette la thèse de la bulle de l'IA, les nouvelles puces Nvidia devraient générer 500 milliards de dollars de chiffre d'affaires

Le redressement d'OpenAI pousse la valeur boursière de Microsoft à dépasser 4 000 milliards de dollars

Adobe Firefly Image 5 : une mise à jour majeure : génération native de 4 millions de pixels, piste audio IA + modèles personnalisés, les créateurs entrent dans l'ère de la création artistique complète avec l'IA

Retard révolutionnaire ! Cartesia lance le moteur d'IA vocale Sonic-3 : une communication extrêmement réaliste avec un retard inférieur à 100 millisecondes

Recommandations d'actualités IA connexes

20 000 dollars pour un double de ménage ? Le robot humanoïde 1X Neo soutenu par OpenAI commence à être vendu en pré-commande, il entrera dans les foyers américains en 2024

Le père de DayZ compare sa peur actuelle envers l'IA à la panique précédente face à Google et Wikipedia

NVIDIA présente un design révolutionnaire pour centres de données AI, favorisant le calcul à haute performance

Liao Qian, ancien responsable du produit AI de Jiansheng de Bytedance, lance son entreprise et lance un Agent multimodal de marketing

Le modèle vocal SoulX-Podcast est officiellement lancé : une génération de podcasts sans interruption pendant 90 minutes, une révolution du vocal IA en phase d'upgrade

Google lance un outil de marketing automatique par IA appelé Pomelli, qui génère du contenu de marketing en entrant l'URL d'un site web

Nvidia's Huang Renxun rejette la thèse de la bulle de l'IA, les nouvelles puces Nvidia devraient générer 500 milliards de dollars de chiffre d'affaires

Le redressement d'OpenAI pousse la valeur boursière de Microsoft à dépasser 4 000 milliards de dollars

Adobe Firefly Image 5 : une mise à jour majeure : génération native de 4 millions de pixels, piste audio IA + modèles personnalisés, les créateurs entrent dans l'ère de la création artistique complète avec l'IA

Retard révolutionnaire ! Cartesia lance le moteur d'IA vocale Sonic-3 : une communication extrêmement réaliste avec un retard inférieur à 100 millisecondes

GEO Services