Le 30 décembre, Alipay a lancé « Tan Yi Xia », sa nouvelle génération de produit de recherche visuelle par IA. Basé sur sa propre technologie de modèle multimodal, il permet d’« explorer le monde avec les yeux de l’IA » et offre un service de recherche générative plus rapide, utile et ludique.
Les utilisateurs peuvent utiliser l’IA, via leur caméra, pour identifier des fleurs, des animaux de compagnie, des jouets à la mode, obtenir des explications touristiques, consulter les détails de produits ou de médicaments, et même obtenir des interprétations amusantes de photos de bébés ou d’animaux de compagnie, facilitant ainsi le partage de photos sur les réseaux sociaux. Ce produit est désormais disponible sur Alipay : il suffit de cliquer sur « Scanner » sur la page d’accueil, puis de faire glisser vers la gauche pour le trouver. Il est également accessible rapidement via l’application Zhi Xiao Bao.
Depuis 2024, Alipay a lancé successivement des applications IA indépendantes comme « Zhi Xiao Bao » et une plateforme de développement d’agents intelligents. Le lancement de « Tan Yi Xia », axé sur la recherche visuelle multimodale par IA, marque une accélération continue de la stratégie IA d’Alipay, au cœur de la stratégie d’Ant Group.
Donner des yeux à l’IA pour explorer le monde qui nous entoure
Ces dernières années, l’intelligence artificielle générative a connu un développement fulgurant, et les technologies multimodales font de la vision un nouveau point d’entrée pour les services numériques. Alipay a lancé « Tan Yi Xia » dans l’espoir de faire de l’IA « l’œil de la curiosité » des gens ordinaires, les aidant à explorer le monde qui les entoure, permettant la recherche, la création et l’interaction par reconnaissance d’images.
Contrairement aux produits de recherche visuelle par IA traditionnels, « Tan Yi Xia » fournit des informations utiles plus rapidement grâce à la reconnaissance d’images par IA. Il offre également une interprétation visuelle plus ludique et des services intelligents plus diversifiés, basés sur une compréhension approfondie des intérêts et du contexte de l’utilisateur.
Après l’avoir testé, nous avons constaté que « Tan Yi Xia » offre actuellement trois services principaux : Explorer les connaissances, Explorer l’inspiration et Explorer le texte.
Pour les objets difficiles à décrire verbalement, « Explorer les connaissances » permet une identification d’images instantanée par IA, pour une acquisition de connaissances immédiate.
Par exemple, les amateurs de plein air et de voyages peuvent facilement obtenir des informations sur des fleurs, des insectes, des plats, des bâtiments, des objets d’exposition inconnus, disposant ainsi d’un « guide touristique intelligent ».
Les jeunes peuvent utiliser l’application pour trouver des guides d’achat pour leurs figurines et jouets préférés ; les parents peuvent identifier 68 types d’Ultraman, évitant ainsi les questions embarrassantes de leurs enfants.
Un internaute utilise « Tan Yi Xia » pour identifier un Ultraman
Pour les produits étrangers dont la description est incompréhensible, « Tan Yi Xia » permet d’obtenir des détails et de faciliter l’achat en ligne de produits similaires ; pour les boîtes de médicaments dont la notice est perdue, l’application fournit non seulement une description détaillée, mais permet également d’accéder au « Gestionnaire de santé IA » d’Alipay pour obtenir des informations complémentaires sur la prise de médicaments.
Grâce aux caractéristiques de l’IA générative, « Explorer l’inspiration » déclenche des filtres visuels intelligents en fonction du contexte, permettant des interprétations amusantes par IA et facilitant la création de légendes pour les photos.
Par exemple, les propriétaires d’animaux de compagnie peuvent prendre des photos de leurs animaux et créer des « messages télépathiques », donnant l’impression que leurs animaux parlent. Les parents qui aiment partager des photos de leurs enfants sur les réseaux sociaux peuvent également utiliser l’IA pour exprimer leur amour pour leurs enfants.
De plus, lors de voyages à l’étranger ou d’apprentissage de langues étrangères, « Explorer le texte » permet d’identifier et de traduire facilement des menus, des panneaux, etc., écrits dans des langues étrangères.
Une recherche visuelle IA renouvelée, Alipay et l’IA accélèrent leur développement
Auparavant, la recherche reposait principalement sur la correspondance de mots clés pour renvoyer des résultats pertinents. En tant que nouvelle génération de produit de recherche visuelle par IA générative, « Tan Yi Xia » ne fournit pas de simples liens de recherche, mais offre une expérience plus intelligente, plus riche et plus interactive grâce à la compréhension et à la capacité de création visuelle du modèle multimodal.
Des données indiquent que les humains acquièrent plus de 80 % de leurs informations par la vue. Les produits d’intelligence artificielle centrés sur la vision peuvent réduire considérablement le seuil d’interaction entre l’homme et l’IA et débloquer davantage de scénarios d’application de l’IA, permettant de réaliser « voir c’est rechercher, voir c’est servir ». À l’étranger, Google Lens, lancé par Google, enregistre plus de 20 milliards d’appels de recherche visuelle par mois ; Apple a également lancé cette année une nouvelle fonctionnalité appelée « Intelligence visuelle », qui permet aux utilisateurs d’« apprendre instantanément tout ce qu’ils voient » via l’appareil photo de leur téléphone.
En tant que plateforme ouverte de vie numérique accueillant des centaines de millions d’utilisateurs, Alipay lance « Tan Yi Xia », son produit de recherche visuelle par IA, et l’intègre à l’entrée principale « Scanner ». L’objectif est de constamment renouveler ses produits pour rendre l’IA aussi pratique que le paiement par code QR pour chacun : non seulement un cerveau capable de dialoguer, des mains et des pieds capables d’agir, mais aussi des yeux capables d’explorer le monde qui nous entoure.
Le lancement intensif de produits IA par Alipay témoigne de l’accélération globale de la stratégie IA First d’Ant Group. En novembre 2023, Ant Group a lancé son propre grand modèle linguistique, Bailin. Depuis septembre de cette année, il a également lancé successivement trois applications IA : Zhi Xiao Bao, Ma Xiao Cai et le Gestionnaire de santé IA, ainsi que la plateforme de développement d’agents intelligents « Boîte à outils », accélérant ainsi la construction d’un écosystème de services IA ouvert.