Le traitement des photos est en train d'être radicalement réinventé par l'intelligence artificielle. Google a tout récemment annoncé une fonction majeure qui remettra en question l'expérience traditionnelle de l'édition photo : les utilisateurs Android peuvent désormais faire éditer leurs photos par l'IA en utilisant un dialogue, que ce soit par commande vocale ou par description écrite, Gemini comprendra précisément vos besoins et les exécutera.

Cette fonction apparemment simple résout en fait un problème central qui dérange depuis longtemps les utilisateurs. Auparavant, pour éditer une photo, vous deviez maîtriser divers outils et filtres complexes, et savoir où ces fonctions se trouvaient dans l'application. À présent, vous n'avez qu'à expliquer à l'IA ce que vous voulez obtenir avec le langage le plus naturel possible, et la machine s'occupe du reste.

Cette fonction d'édition intelligente pilotée par Gemini était initialement exclusive aux appareils Pixel 10 aux États-Unis, et a été présentée pour la première fois en août de cette année. Maintenant, Google décide de généraliser cette fonction phare à tous les appareils Android, ce qui constitue certainement une importante mise à niveau de l'écosystème de la photographie mobile.

image.png

La méthode d'utilisation est incroyablement simple. Il suffit de cliquer sur le bouton "Aidez-moi à éditer" dans l'éditeur, puis de décrire avec un langage naturel les effets que vous souhaitez modifier. Si vous ne savez pas par où commencer, le système propose également des suggestions intelligentes de Gemini, et vous pouvez même dire "rendez-le meilleur", et l'IA analysera automatiquement et optimisera la photo.

L'importance de cette fonction réside dans sa couverture large. De l'ajustement de la lumière de base, en passant par la suppression d'éléments perturbateurs dans l'image, jusqu'à la suppression avancée d'objets en arrière-plan ou la restauration de vieilles photos, Gemini y parviendra facilement. Ce qui est encore plus excitant, c'est qu'elle peut ajouter des éléments imaginatifs créés par l'IA aux photos, transformant ainsi des photos ordinaires en quelque chose de créatif et amusant.

Pendant le processus d'édition, Gemini démontre une excellente capacité à comprendre et à apprendre. Non seulement il traite les demandes initiales d'édition, mais il supporte également des instructions de raffinement ultérieures, aidant les utilisateurs à affiner leur travail jusqu'à ce qu'ils soient satisfaits. Cette expérience d'édition en mode conversation continue rend le processus d'édition aussi naturel et fluide que si vous discutiez avec un designer professionnel.

Actuellement, cette fonction d'édition par IA est disponible uniquement aux utilisateurs américains âgés de plus de 18 ans et parlant anglais. Cette restriction provient principalement de considérations liées à la protection de la vie privée des mineurs et à la sécurité du contenu. Cependant, compte tenu de l'attitude proactive de Google concernant la diffusion mondiale de ses fonctions d'IA, il est probable que cette fonction soit rapidement étendue à plus de pays et de langues.

Avec la fonction d'édition par IA, Google Photos a également introduit le support des certificats de contenu C2PA. Bien que cette fonction semble technique, elle a une importance pratique majeure : elle permet d'identifier et de marquer les contenus images créés par l'IA. Dans un monde où les fausses images et les contenus générés par l'IA sont de plus en plus fréquents, cette fonction d'identification est essentielle pour préserver l'authenticité des informations et le droit à l'information des utilisateurs.

Cette fonction a également été initialement lancée sur les appareils Pixel, et est maintenant officiellement étendue à tous les utilisateurs Android. Google a confirmé cette information à TechCrunch, ce qui montre que l'entreprise ne se contente pas de parler de son engagement en matière de transparence de l'IA et de véracité du contenu, mais le met effectivement en œuvre via des mesures techniques concrètes.

D'un point de vue technologique, la publication de ces fonctions par Google illustre plusieurs tendances importantes. Tout d'abord, la démocratisation des outils d'IA : les opérations techniques complexes sont simplifiées en interactions linguistiques naturelles, réduisant ainsi fortement le seuil d'accès. Ensuite, l'intelligence des fonctions augmente constamment : l'IA ne comprend pas seulement les intentions des utilisateurs, mais propose également activement des conseils d'optimisation.

Plus important encore, ce modèle d'édition en mode conversation prédit un changement fondamental dans la manière dont les humains interagissent avec les machines. Les interfaces graphiques traditionnelles sont complétées par des interactions vocales et textuelles plus intuitives, voire remplacées dans certains scénarios. Ce changement ne se limite pas au domaine de l'édition photo, mais touche l'ensemble de l'industrie logicielle qui évolue vers cette direction.

Pour les utilisateurs ordinaires, le lancement de cette fonction signifie que les barrières à la création de photos avec un téléphone sont encore réduites. Vous n'avez plus besoin d'apprendre des compétences d'édition complexes, ni d'acheter des logiciels coûteux, il suffit d'avoir des idées créatives, et l'IA vous aidera à les réaliser. Cette tendance à la démocratisation de la technologie permet à de plus en plus de personnes de créer des contenus visuels de niveau professionnel.