Récemment, le média technologique The Decoder a rapporté que Google DeepMind a lancé un nouveau modèle d'édition d'images, Gemini2.5Flash. Ce modèle mis à jour offre aux utilisateurs une expérience d'édition d'images plus précise dans l'application Gemini, permettant aux utilisateurs de modifier radicalement des photos grâce à des instructions textuelles, sans affecter l'apparence des personnes et des animaux.
Par rapport aux outils de génération d'images précédents, Gemini2.5Flash montre une plus grande précision lors du traitement d'instructions textuelles complexes, dépassant même GPT-4o utilisé par ChatGPT dans plusieurs tâches. Cette amélioration permet aux utilisateurs de réaliser plus facilement leurs créations lors de l'édition d'images.
Un point fort de Gemini2.5Flash est sa fonctionnalité "cohérence des personnages". Même lors de la génération de plusieurs images, l'apparence des personnages, animaux ou objets spécifiés par l'utilisateur reste cohérente, indépendamment des postures, arrière-plans ou conditions d'éclairage. Cette fonctionnalité est particulièrement utile pour les séries de photos de marque ou les présentations multivues de produits, augmentant considérablement l'efficacité de la création de matériel et de catalogues de produits.
En outre, Gemini2.5Flash prend en charge une édition précise du texte local. Les utilisateurs peuvent effectuer facilement des opérations telles que le flou d'arrière-plan, la suppression des défauts, l'ajout de couleurs ou la suppression d'objets, sans avoir besoin de sélectionner manuellement. Il peut même fusionner jusqu'à trois images en une seule, comme combiner une photo de produit avec une photo intérieure pour créer un scénario réaliste. De plus, il dispose d'une fonctionnalité de transfert de style, qui permet d'appliquer une texture, une couleur ou un motif à un autre objet tout en préservant l'intégrité de sa forme et de ses détails.
La fonctionnalité "raisonnement réel" de Gemini2.5Flash dépasse les limites traditionnelles de l'édition d'images, pouvant simuler des relations causales simples, comme générer une image montrant un ballon volant vers un cactus et le résultat suivant. Ces fonctions innovantes font de Gemini2.5Flash non seulement un outil puissant de retouche photo, mais aussi une plateforme de création qui permet aux utilisateurs d'exprimer leur imagination.