Dans le domaine de la génération d'images par IA, la méthode traditionnelle consistant à utiliser des invites textuelles est assez courante. Cependant, Whisk, lancé par Google, propose une approche totalement nouvelle axée sur le visuel. Il permet aux utilisateurs d'utiliser des images comme entrée pour générer et remixer des créations, offrant ainsi aux créateurs une expérience de génération d'images plus intuitive et plus créative.
Présentation de Whisk
Whisk est un outil d'IA générative innovant lancé par Google Labs. S'appuyant sur les modèles Gemini et Imagen 3, il génère de nouvelles images à partir d'images fournies par l'utilisateur, représentant le sujet, la scène et le style. Cet outil est principalement destiné à l'exploration créative, visant à aider les utilisateurs à générer et itérer rapidement diverses idées créatives, et non à l'édition précise d'images. Actuellement, Whisk n'est accessible qu'aux utilisateurs américains (adresse IP américaine) via labs.google/whisk, où ils peuvent utiliser l'outil et fournir des commentaires.
Points forts de Whisk
- Génération pilotée par l'image : les utilisateurs peuvent télécharger des images pour définir le sujet, la scène et le style, au lieu d'utiliser des invites textuelles. Cela offre une méthode plus simple aux utilisateurs qui ne sont pas à l'aise avec la rédaction d'invites textuelles. Par exemple, un utilisateur peut télécharger une image de chat comme sujet, une image de feuille de lotus comme scène et une image avec des éléments brillants comme style pour générer une image unique.
- Génération automatique de légendes détaillées : le modèle Gemini rédige automatiquement des légendes descriptives détaillées pour les images téléchargées par l'utilisateur. Ces descriptions sont ensuite introduites dans le modèle Imagen 3 afin de mieux saisir les caractéristiques clés de l'image et de générer une nouvelle image conforme à l'intention de l'utilisateur.
- Remixage créatif : permet de remixer différentes images de sujets, de scènes et de styles pour créer des designs uniques, tels que des poupées numériques, des broches en émail, etc.
- Capture de l'essence, pas de la copie : il capture les caractéristiques essentielles des images d'entrée, sans les copier précisément. Cela permet aux images générées d'offrir plus de variations créatives, mais peut également entraîner des résultats qui ne correspondent pas parfaitement aux attentes de l'utilisateur.
- Invites modifiables : les utilisateurs peuvent consulter et modifier les informations d'invite sous-jacentes afin d'ajuster et d'optimiser les images générées en fonction de leurs besoins, par exemple en modifiant la couleur, les motifs, etc.
Applications
- Conception créative : les designers peuvent utiliser Whisk pour explorer rapidement différentes orientations de conception, en téléchargeant diverses images pertinentes pour générer des idées créatives, par exemple pour concevoir l'apparence unique d'un nouveau produit.
- Création artistique : les artistes peuvent utiliser Whisk pour la conception préliminaire de leurs créations artistiques, en fusionnant et en expérimentant différents éléments via l'entrée d'images, par exemple pour créer une peinture sur un thème fantastique, en téléchargeant des images de créatures fantastiques, de paysages, etc., pour obtenir des idées créatives.
- Personnalisation de produits : pour les industries de personnalisation de produits, telles que les badges, les autocollants, etc., Whisk peut aider les utilisateurs à générer rapidement diverses options de conception possibles. Il suffit de télécharger des images représentant les sujets, les scènes et les styles préférés de l'utilisateur pour obtenir un design personnalisé unique.
- Marketing publicitaire : les planificateurs de campagnes publicitaires peuvent utiliser Whisk pour générer divers supports publicitaires créatifs. En téléchargeant des images de sujets liés au produit ainsi que des images de scènes et de styles conformes à l'image de marque, ils peuvent rapidement obtenir des images publicitaires attrayantes pour les campagnes publicitaires en ligne et hors ligne.
- Éducation : dans le domaine de l'éducation, les enseignants peuvent utiliser Whisk pour faciliter l'enseignement, par exemple en cours d'art, en permettant aux élèves de télécharger des images de choses qui les intéressent pour stimuler leur créativité et développer leur imagination.
Tutoriel Whisk
- Accès à l'outil : les utilisateurs disposant d'une adresse IP américaine peuvent accéder à la page de l'outil Whisk via labs.google/whisk.
- Téléchargement d'images : en fonction du contenu de l'image à générer, téléchargez des images représentant le sujet, la scène et le style. Si vous ne disposez pas d'images appropriées, vous pouvez également cliquer sur l'icône de dé à jouer pour obtenir des suggestions d'images (ces images peuvent également être générées par IA).
- Génération d'images : après le téléchargement des images, Whisk génère automatiquement de nouvelles images et les invites textuelles correspondantes.
- Affichage et ajustement : affichez les images générées. Si vous n'êtes pas satisfait, vous pouvez ajuster et optimiser l'image en modifiant les informations de la zone de texte des invites ou en cliquant sur l'image et en modifiant l'invite textuelle correspondante.
- Téléchargement ou sauvegarde : si vous êtes satisfait des images générées, vous pouvez les télécharger et les enregistrer, ou les ajouter à vos favoris pour une utilisation ultérieure.
Conclusion
Whisk, outil de génération d'images par IA innovant, offre aux utilisateurs une expérience créative inédite grâce à son mode d'entrée d'images unique et à sa fonction de remixage créatif. Il présente un potentiel d'application dans de nombreux domaines, tels que la conception créative, la création artistique et la personnalisation de produits. Bien qu'il ne soit actuellement accessible qu'aux utilisateurs américains et que certains résultats de génération puissent ne pas être parfaits, l'orientation de la génération d'images par IA axée sur le visuel qu'il représente mérite notre attention.
Si vous êtes intéressé par la créativité et la génération d'images par IA, n'hésitez pas à aimer, commenter et suivre l'évolution de Whisk. Nous attendons avec impatience qu'il nous réserve de nouvelles surprises et possibilités à l'avenir.