Google et l'équipe de Fei-Fei Li de Stanford lancent W.A.L.T.

Google et l'équipe de Fei-Fei Li de l'université de Stanford ont collaboré pour lancer W.A.L.T., un nouveau modèle de génération de vidéos. Basé sur l'architecture Transformer, il atteint un réalisme comparable à celui de Gen-2.

Ce modèle, entraîné conjointement sur des images et des vidéos, résout des problèmes de modélisation complexes grâce à des décisions clés. En utilisant un modèle de diffusion vidéo latent, il marque une nouvelle ère pour la technologie vidéo basée sur l'IA.