L'équipe de développement du grand modèle linguistique Doubao de ByteDance a récemment lancé SeedEdit, le premier modèle d'édition d'images universel à être commercialisé en Chine. Cette technologie est déjà disponible en test sur la version PC de Doubao et sur la version web de Jimeng. Cette avancée technologique révolutionnaire permet aux utilisateurs d'obtenir des résultats d'édition d'images professionnels grâce à de simples instructions textuelles.

image.png

SeedEdit, un outil d'édition d'images révolutionnaire, surmonte les obstacles techniques de l'édition d'images traditionnelle. Les utilisateurs peuvent facilement réaliser des retouches, des changements de vêtements, des améliorations, des conversions de style, ainsi que des opérations complexes telles que l'ajout ou la suppression d'éléments dans des zones spécifiques, le tout grâce à des instructions en langage naturel. Par exemple, après avoir généré une image d'"un chiot courant dans un pré", l'utilisateur peut simplement saisir l'instruction "changer l'arrière-plan pour une plage" pour obtenir un résultat parfait.

Lors du développement du modèle, l'équipe de ByteDance a innové en résolvant le problème de la rareté des données. Grâce à une solution de création de données multi-modèles, multi-échelles et multi-normes, la quantité, la diversité et la qualité des données ont été considérablement améliorées. Comparé aux technologies existantes sur le marché, SeedEdit a réalisé des avancées significatives en termes d'universalité, de contrôlabilité et de qualité de sortie. Notamment, dans des tâches traditionnelles telles que la segmentation d'images, les images générées par SeedEdit sont plus naturelles et ne présentent pas d'effet de "collage" évident.

image.png

Lors des tests de performance, SeedEdit a obtenu d'excellents résultats sur des benchmarks tels que HQ-Edit. Il est capable non seulement de comprendre des instructions vagues, mais aussi de maintenir un taux de conservation et de réussite plus élevé lors de la réalisation d'éditions précises. Actuellement, le modèle prend en charge les entrées en chinois et en anglais, et peut identifier avec précision les expressions idiomatiques et les noms propres chinois.

L'équipe Doubao précise que bien que SeedEdit produise actuellement de meilleurs résultats avec des images générées par le modèle qu'avec des images réelles, l'équipe travaille continuellement à l'amélioration des performances du modèle. À l'avenir, l'accent sera mis sur l'amélioration du traitement des images réelles, de la capacité de maintien de l'identité et de la précision de l'édition, ainsi que sur l'exploration de la génération de contenus narratifs et de bandes dessinées à longue séquence temporelle, afin de fournir aux utilisateurs un outil de création plus puissant.

Adresse d'essai : https://top.aibase.com/tool/seededit