Le 26 avril 2025, AIbase a rapporté qu'OpenAI a récemment annoncé que la fonctionnalité de génération d'images de son modèle multi-modal phare GPT-4o est désormais officiellement intégrée à la fonctionnalité GPT personnalisés de ChatGPT. Cette mise à jour signifie que les assistants IA personnalisés créés par les utilisateurs peuvent désormais générer et éditer directement des images, ouvrant ainsi de nouvelles possibilités dans les domaines de la création de contenu, de la conception et de l'éducation.
Une expérience de génération d'images intégrée
La fonctionnalité de génération d'images de GPT-4o a été progressivement déployée auprès des utilisateurs gratuits, Plus, Pro et Team sur ChatGPT et la plateforme Sora depuis le 25 mars 2025. Contrairement aux solutions précédentes qui dépendaient de modèles externes comme DALL-E3, la capacité de génération d'images de GPT-4o est intégrée au modèle lui-même, permettant de générer des images de haute qualité directement à partir d'invites textuelles. Aujourd'hui, cette fonctionnalité est étendue aux GPT personnalisés. Les utilisateurs peuvent activer l'option « GPT-4o Image Generation » dans l'éditeur de GPT personnalisés de ChatGPT pour créer un assistant IA personnalisé capable de générer des images. Cette mise à jour remplace le backend DALL-E3 précédent, améliorant considérablement la vitesse de génération et la qualité des images.
Points forts et scénarios d'application
L'application de la génération d'images GPT-4o aux GPT personnalisés offre une flexibilité et une utilité exceptionnelles. Les utilisateurs peuvent générer des images photoréalistes, des illustrations stylisées ou des actifs de conception complexes à l'aide d'invites en langage naturel. Voici ses principaux avantages :
Rendu de texte précis : GPT-4o peut intégrer du texte clair et lisible dans les images, idéal pour la création de graphiques, de menus, d'invitations ou d'infographies.
Optimisation des interactions multi-tours : Les utilisateurs peuvent ajuster progressivement les détails de l'image via une conversation. Le modèle maintient la cohérence contextuelle, ce qui est idéal pour la conception de personnages, le développement d'actifs de marque ou la création de storyboards nécessitant plusieurs itérations.
Respect des instructions complexes : Le modèle prend en charge le traitement d'invites détaillées contenant 10 à 20 objets, garantissant l'exactitude des relations et des caractéristiques des objets.
Adaptation à divers styles : Du réalisme au dessin animé, du dessin à main levée à la haute résolution, GPT-4o peut générer des images dans une variété de styles artistiques pour répondre à différents besoins créatifs.
Par exemple, un GPT personnalisé dans le secteur de la mode peut générer des croquis de vêtements, un GPT dans le secteur de l'éducation peut créer des graphiques pédagogiques intuitifs, et un GPT dans le secteur du marketing peut générer rapidement du contenu pour les réseaux sociaux. Ces fonctionnalités permettent aux utilisateurs de créer du contenu visuel de haute qualité sans avoir besoin de compétences de conception professionnelles.
Mode d'emploi et limitations
Pour utiliser la fonctionnalité de génération d'images de GPT-4o, les utilisateurs doivent activer l'option correspondante dans l'éditeur de GPT personnalisés de ChatGPT et décrire l'image souhaitée à l'aide d'une invite textuelle, en spécifiant des détails tels que les codes couleur, le ratio largeur/hauteur ou un arrière-plan transparent. Le processus de génération peut prendre de quelques secondes à une minute, selon la complexité de l'invite. Malgré sa puissance, la mise en œuvre actuelle présente certaines limitations. Par exemple, certains utilisateurs ont signalé que la stabilité de la génération d'images suivant les instructions des GPT personnalisés était d'environ 50 %, ce qui indique que la fonctionnalité est encore en phase expérimentale. De plus, les grandes images, comme les affiches, peuvent présenter des problèmes de rognage qui nécessitent une optimisation supplémentaire. OpenAI a déclaré qu'il améliorerait la stabilité et les performances de la fonctionnalité grâce à des mises à jour continues.
Accès large et sécurité
Actuellement, la fonctionnalité de génération d'images GPT-4o est accessible à tous les niveaux d'abonnement ChatGPT, y compris les utilisateurs gratuits (limités à 3 utilisations par jour). Les utilisateurs professionnels, éducatifs et les développeurs d'API devraient avoir accès dans les prochaines semaines. Pour garantir la sécurité du contenu, toutes les images générées intègrent des métadonnées C2PA indiquant leur origine. OpenAI a également déployé des outils de recherche interne et des systèmes d'audit pour limiter strictement la génération de contenu impliquant de vraies personnes, de la nudité ou de la violence.
Impact significatif sur les développeurs
Pour les développeurs, le lancement imminent de l'API de génération d'images GPT-4o facilitera son intégration dans les applications. Par rapport aux modèles de génération d'images traditionnels, l'architecture multimodale de GPT-4o réduit les coûts de commutation entre les modèles, offrant une expérience de développement plus fluide. Cette mise à jour suggère également qu'OpenAI s'efforce de construire une pile technologique multimodale unifiée entre ChatGPT, Sora et l'API, ce qui permettra probablement des extensions de fonctionnalités plus larges à l'avenir.
Perspectives d'avenir
L'application de la fonctionnalité de génération d'images GPT-4o aux GPT personnalisés améliore non seulement l'utilité des assistants IA, mais fournit également aux utilisateurs des outils de création plus intuitifs et efficaces. Bien que certains défis techniques, tels que la stabilité du respect des instructions et les problèmes de rognage des images, doivent encore être résolus, son potentiel est évident. AIbase prévoit qu'avec l'optimisation continue du modèle par OpenAI et l'élargissement de l'accès à l'API, GPT-4o entraînera des changements importants dans les domaines de la création de contenu, de la conception commerciale et de l'éducation. AIbase continuera de suivre les derniers développements de GPT-4o afin de vous fournir des informations approfondies sur les technologies IA de pointe.