Lors de la conférence Google I/O 2025, Google a présenté ses dernières avancées dans les technologies d'intelligence artificielle et de réalité augmentée/virtuelle (RA/RV), couvrant trois domaines clés : les outils de création, la plateforme pour développeurs et l'expérience utilisateur. La nouvelle génération du générateur vidéo Veo3, le générateur d'image Imagen4, la toute nouvelle plateforme RA Android XR, ainsi que le service d'abonnement premium "AI Ultra" ont été au centre des annonces.

En tant qu'outil phare pour la création d'IA, Veo3 peut générer des vidéos avec pistes sonores natives, une fonctionnalité qui distingue ce produit des actuels concurrents comme OpenAI Sora qui ne supportent pas encore l'audio. Il est désormais disponible pour les utilisateurs d'Ultra aux États-Unis et pour les clients d'entreprise Vertex AI. Imagen4 offre un meilleur agencement et plus de détails sur les images tout en supportant plusieurs formats de sortie. Les deux sont intégrés à des applications comme Gemini, Workspace, Whisk et la nouvelle plateforme de production de films IA Flow.

QQ20250521-090033.png

Flow combine la génération de scènes, le contrôle des plans et la gestion des ressources, permettant aux utilisateurs de mélanger contenu IA et original pour créer des flux de contenu cinématographique complets. De plus, Google a lancé le modèle de génération musicale Lyria via YouTube Shorts et Vertex AI pour les créateurs de musique.

Pour répondre aux besoins des créateurs professionnels et des entreprises, Google propose un abonnement AI Ultra mensuel à 249,99 dollars offrant des services de haut niveau tels que Veo3, Imagen4, l'outil d'agence Project Mariner, YouTube Premium, et 30 To de stockage cloud. Une version Pro est également disponible.

Gemini Live sera bientôt disponible sur l'application Gemini, permettant la collaboration en direct via caméra et partage d'écran, idéal pour le dépannage et la planification d'événements. Les fonctions de Gemini sont également intégrées à Chrome pour l'analyse et le résumé de contenu web.

Dans le domaine de la communication, Google Meet introduit une fonction de traduction AI simulant le ton et les expressions, disponible initialement en anglais et espagnol, réservée aux utilisateurs Pro et Ultra. Gmail proposera également des réponses intelligentes personnalisées basées sur les e-mails historiques de l'utilisateur, sous réserve de l'autorisation de celui-ci.

Côté développement, l'API Gemini ajoute des fonctions avancées comme les fonctions asynchrones, l'audio natif et le protocole de contexte d'outils (MCP). De nouveaux modèles comme Gemma3n (modèle mobile léger), **MedGemma (applications médicales)** et SignGemma (reconnaissance des signes) élargissent encore davantage le paysage des modèles IA de Google.

Pour renforcer la crédibilité du contenu IA, Google a également lancé le portail SynthID Detector, capable de détecter des marques invisibles pour identifier si des images, textes, sons ou vidéos sont générés par IA, avec déjà des milliards de projets utilisant ce système de marquage.

Enfin, Google a annoncé le lancement d'une toute nouvelle plateforme AR/MR Android XR, destinée à fournir un système d'exploitation pour les futurs appareils de RV (y compris les lunettes AR et les casques). En combinant l'intelligence de Gemini, ces appareils seront capables de traduction en temps réel, d'analyse d'environnement et de gestion de messages. Google collabore déjà avec des marques comme Gentle Monster et Warby Parker et lancera un SDK cette année.

La conférence a montré que Google s'efforce d'intégrer profondément les capacités d'IA dans ses produits, la création de contenu et les plateformes finales, visant à se positionner pleinement dans l'écosystème IA natif.