Google DeepMind a annoncé aujourd'hui l'introduction d'une fonctionnalité révolutionnaire appelée « édition précise » pour son modèle de génération vidéo avancé Veo. Cette fonction permet aux utilisateurs d'ajouter ou de supprimer facilement des éléments tels que des accessoires, des personnages ou des objets du fond dans une vidéo existante en utilisant simplement des indications textuelles. Le modèle reconstruit intelligemment la scène afin de garantir la réalisme physique et la cohérence visuelle, tout en préservant parfaitement l'intégrité originale de la vidéo.

Selon un rapport d'AIbase, cette mise à jour marque un passage de la génération糙到的后处理 à une édition plus fine, augmentant considérablement l'efficacité de production des créateurs sur la plateforme Flow. La fonction d'édition précise de Veo fait partie de la mise à jour Veo3.1, conçue spécifiquement pour les outils de production de films AI de Google, Flow. Elle utilise des algorithmes avancés d'IA générative, prenant en compte l'éclairage, les proportions, les interactions entre les objets et les trajectoires de mouvement, pour effectuer des modifications sans faille.

Par exemple, les utilisateurs peuvent indiquer « ajouter un car scolaire jaune à la scène » ou « supprimer une personne au bord de la route », et le modèle remplira automatiquement le fond, ajustera les ombres et maintiendra la cohérence du mouvement de la caméra, évitant ainsi les sauts de cadres ou les traces incohérentes courants dans les logiciels de montage traditionnels. Dans la vidéo de démonstration, cette fonction montre le processus complet allant d'une image statique à une narration dynamique en plusieurs plans. Les utilisateurs peuvent itérer rapidement leur contenu en quelques secondes, sans avoir besoin de reprendre des images ou de masquer manuellement.

 Selon l'analyse d'AIbase, les innovations principales du Veo3.1 incluent une synchronisation audio améliorée, la génération de scènes avec plusieurs indicateurs et une sortie native en 1080p, permettant d'élargir la durée des vidéos jusqu'à une minute. Cela rend l'édition précise applicable non seulement aux créateurs de courts métrages, mais aussi aux publicités, au marketing et à la formation d'entreprises. Par exemple, sur Flow, les utilisateurs peuvent charger des « composants » (comme des personnages prédéfinis ou des références de style), puis étendre les plans via l'édition précise, automatisant ainsi le passage d'une seule image à un storyboard complet. Comparé à la version précédente Veo3, ce modèle améliore de plus de 30 % la cohérence des personnages et le contrôle narratif. Les tests de base montrent une précision d'édition de 95 %, bien supérieure à celle des concurrents comme Sora2 d'OpenAI. « L'édition précise rend véritablement démocratisée la création de vidéos par IA, permettant aux utilisateurs de réaliser des modifications de niveau hollywoodien sans compétences professionnelles »,