Google a annoncé à l'échelle mondiale sa dernière génération de modèle d'IA générant des vidéos à partir de textes, Veo3, désormais disponible pour les abonnés Google AI Pro et Ultra. Ce modèle de génération de vidéos développé par Google DeepMind est rapidement devenu le point de mire du domaine de la génération vidéo par IA grâce à sa qualité HD exceptionnelle, sa synchronisation audio-vidéo et ses fonctionnalités de création multimodale.
Veo3 : redéfinir la génération vidéo par IA
Lors de la conférence Google I/O 2025, Veo3 a été présenté pour la première fois et a été considéré comme un produit phare dans le domaine de la génération vidéo par IA de Google. Comparé à ses prédécesseurs, Veo3 a réalisé des progrès notables dans les domaines suivants :
- Qualité HD et réalisme physique : Veo3 permet de générer des vidéos en haute définition 1080p, avec des tests internes atteignant même une résolution 4K. Les images vidéo sont non seulement détaillées, mais elles peuvent également simuler précisément les effets lumineux et les lois physiques du monde réel, produisant des animations fluides et naturelles, presque indiscernables des prises de vue réelles.
- Génération native d'audio : En tant que premier modèle de Google capable de générer simultanément des vidéos et des sons, Veo3 peut générer automatiquement des effets sonores réalistes (comme le bruit des vagues ou le chant des oiseaux), les dialogues des personnages et la musique d'ambiance, améliorant ainsi significativement l'immersion dans la vidéo.
- Capacités de création multimodale : Les utilisateurs peuvent générer des vidéos à partir de descriptions textuelles ou d'images, soutenant des instructions complexes et des narrations multi-scènes, assurant ainsi une cohérence élevée entre les personnages, les scènes et le style.
Ces caractéristiques font de Veo3 un outil prometteur dans les domaines du cinéma, de la publicité, de l'éducation et de la formation. Par exemple, un créateur n'a qu'à entrer une simple description, comme « rue urbaine sous les néons en pleine nuit, gouttes de pluie tombant sur le sol, écho des pas des passants », et Veo3 générera alors une courte vidéo comprenant des images réalistes, des effets sonores environnementaux et des lumières dynamiques.
Détails de l'accès aux abonnements : différences entre les abonnements Pro et Ultra
Selon un communiqué officiel de Google, Veo3 est désormais accessible via l'application Gemini et la plateforme Flow aux abonnés Google AI Pro et Ultra du monde entier. Les droits d'utilisation spécifiques sont les suivants :
- Abonné Google AI Pro (environ 20 dollars par mois) : les utilisateurs peuvent générer 3 vidéos par jour et profiter des fonctionnalités principales de Veo3. Idéal pour les créateurs individuels ou les petits groupes souhaitant essayer la création vidéo par IA.
- Abonné Google AI Ultra (249,99 dollars par mois) : offre un quota d'utilisation plus élevé (le nombre exact de générations n'est pas divulgué), prend en charge des besoins créatifs plus complexes tels que la narration multi-scènes et le contrôle avancé de la caméra, idéal pour les équipes professionnelles de production cinématographique et les utilisateurs professionnels.
Il convient de noter que Veo3 n'est actuellement disponible que dans les régions prenant en charge l'application Gemini (comme les États-Unis, l'Inde, l'Europe, etc.), et certains utilisateurs devront attendre une ouverture progressive. De plus, toutes les vidéos générées par Veo3 portent un tampon visible et un tampon numérique SynthID, afin de garantir la traçabilité du contenu et de respecter les politiques de sécurité de Google.
En outre, Josh Woodward, vice-président de Google, a révélé que la fonctionnalité « génération de vidéos à partir d'images » de Veo3 est presque terminée et sera bientôt mise en ligne.
Impact industriel et perspectives futures
Le lancement de Veo3 ne fournit pas seulement un outil efficace de génération vidéo aux créateurs individuels, mais il constitue également un défi pour les logiciels de montage vidéo traditionnels et les produits d'avatar numériques. Sa fonction de synchronisation audio-vidéo simplifie grandement le processus de création ; autrefois nécessitant plusieurs outils d'IA travaillant ensemble pour générer les images, les effets sonores et les dialogues, cela peut maintenant être fait en une seule étape avec Veo3.
En même temps, la plateforme Flow