O Google, em colaboração com a equipe de Fei-Fei Li da Stanford, lançou o modelo de geração de vídeo W.A.L.T., baseado na arquitetura Transformer, alcançando resultados de realismo comparáveis ao Gen-2. O modelo treina imagens e vídeos conjuntamente, resolvendo desafios de modelagem por meio de decisões-chave. Utilizando um modelo de difusão de vídeo latente, ele marca uma nova era na tecnologia de vídeo com IA.
W.A.L.T: Modelo de Geração de Vídeo Transformer da Google em parceria com Fei-Fei Li

站长之家
Este artigo é do AIbase Daily
Bem-vindo à coluna [AI Daily]! Este é o seu guia para explorar o mundo da inteligência artificial todos os dias. Todos os dias apresentamos os destaques da área de IA, com foco nos desenvolvedores, para o ajudar a obter insights sobre as tendências tecnológicas e a compreender as aplicações inovadoras de produtos de IA.