Nos últimos dias, o modelo de geração de vídeo abab-video-1, lançado pela MiniMax, chamou a atenção no mundo todo. Não apenas os internautas chineses estão animados, mas também os usuários internacionais têm avaliações positivas.
A experiência geral mostra que a geração de vídeo é fácil de usar, bastando inserir uma frase simples para gerar um vídeo fluido. O movimento geral do vídeo é estável e as ações das personagens são muito naturais.
Um influenciador no X chamado "Ryan Morrison" afirmou que o abab-video-1 apresenta a geração de movimentos de mãos mais natural que ele já viu.
Outros influenciadores geraram vídeos de "Star Wars" usando o abab-video-1. Em termos de cores e estética, já tem o "quê" de um filme de Hollywood. Além disso, a filmagem é fluida, com grandes amplitudes de movimento e sem falhas.
Ainda há influenciadores que fizeram uma comparação, afirmando que o abab-video-1 supera o RunwayML em estética e desempenho de vídeo. Será mesmo?
abab-video-1 VS RunwayML: Comparação de Resultados Reais
Abaixo, a AIbase realizou testes com três prompts diferentes. Vamos ver os resultados da comparação!
Teste de Comparação 1: Paisagem Urbana (Prompt Complexo)
Prompt 1: Mostre uma cidade moderna gradualmente retornando ao passado. Os arranha-céus desaparecem lentamente, dando lugar a edifícios antigos; os carros se transformam em carruagens, as pessoas nas ruas usam roupas de épocas passadas. A cidade inteira parece estar viajando no tempo, levando os espectadores a experimentar diferentes épocas.
Vídeo gerado pela AIbase usando o abab-video-1
Podemos ver que o abab-video-1 compreendeu bem o prompt, e a transição gradual entre edifícios antigos e modernos é bastante natural. O desempenho é muito bom.
O mesmo prompt gerou o seguinte resultado no RunwayML:
Vídeo gerado pela AIbase usando o RunwayML
O RunwayML parece ter tido dificuldades em compreender prompts complexos e longos. Pelo vídeo, parece ter compreendido apenas a primeira parte, sem gerar a transformação de edifícios modernos para antigos. Se usássemos imagem para gerar vídeo, o RunwayML provavelmente teria um melhor desempenho.
Teste de Comparação 2: Pessoas em um Bar (Prompt Complexo)
Prompt 2: 5 pessoas sentadas no balcão de um bar, mostrando as flutuações emocionais das 5 pessoas através de mudanças de cor. A imagem deve focar nos rostos, com a cor de fundo mudando de acordo com as expressões. Alegria: cores quentes e brilhantes; Tristeza: tons escuros e frios; Raiva: cores vibrantes e intensas. O fluxo de cores mostra as mudanças sutis de emoção, permitindo que a audiência sinta o mundo interior das personagens.
No prompt 2, a AIbase definiu vários detalhes complexos, como "mudanças de emoção" e "mudanças de tom de fundo de acordo com as emoções", além de aumentar o número de personagens, aumentando a dificuldade.
Vídeo gerado pela AIbase usando o abab-video-1
Aparentemente, o abab-video-1 não teve problemas, a mudança de emoção das personagens é natural, os rostos não estão distorcidos e o tom de fundo muda de acordo com as emoções, com um forte poder expressivo.
Vídeo gerado pela AIbase usando o RunwayML
Com o mesmo prompt, o RunwayML gerou um vídeo com uma personagem a menos, os rostos estão distorcidos e os tons não mudam de acordo com as emoções.
Teste de Comparação 3: Um Casal Sob as Estrelas (Prompt Simples)
Talvez os prompts fossem longos e complexos demais, vamos tentar um prompt mais simples~
Prompt 3: Um casal de mãos dadas caminhando sob um céu estrelado, com a Via Láctea se movendo lentamente ao fundo.
Vídeo gerado pela AIbase usando o abab-video-1
O vídeo gerado pelo abab-video-1 não apresenta problemas, desde a amplitude de movimento até a composição e a estética. O movimento do casal caminhando também é natural.
Vídeo gerado pela AIbase usando o RunwayML
O céu estrelado gerado pelo RunwayML também não apresenta problemas, o único pequeno defeito é que o casal na parte inferior ocupa pouco espaço na imagem, sendo facilmente ignorado. A forma das personagens também está um pouco distorcida, mas ainda aceitável.
Resultados da Comparação
Pelos testes acima, pelo menos na geração de vídeo a partir de texto, o abab-video-1 realmente superou o RunwayML. Atualmente, a vantagem do RunwayML está em suas funções mais ricas, incluindo geração de vídeo a partir de imagem, frames iniciais e finais, etc., com melhor desempenho do que a geração de vídeo a partir de texto. Como o abab-video-1 só gera vídeo a partir de texto, não é possível comparar a geração de vídeo a partir de imagem.
Em resumo, as principais vantagens do abab-video-1 são:
Nível estético: Os vídeos gerados pelo modelo abab-video-1 têm uma melhoria significativa na estética, com combinações de cores mais harmoniosas e composições mais elaboradas.
Movimento da câmera: Em comparação com o RunwayML, o abab-video-1 tem melhor desempenho nas técnicas de filmagem, apresentando transições de imagem e movimentos de câmera mais suaves e naturais.
Expressão facial: O abab-video-1 apresenta modelagem mais rica e delicada das expressões faciais, transmitindo melhor as emoções e a história.
Apresentação de texto: Em cenários que exigem a exibição de texto, o abab-video-1 tem um desempenho melhor, com layout e design de texto mais estéticos e fáceis de ler.
Coerência do vídeo: Os vídeos gerados pelo abab-video-1 têm um desenvolvimento de enredo e transições de imagem mais coerentes, com maior capacidade de storytelling.
Espaço criativo: O abab-video-1 oferece aos criadores um espaço criativo mais amplo, permitindo que eles realizem efeitos visuais e métodos narrativos exclusivos.
Interessados podem experimentar: https://top.aibase.com/tool/hailuowenwen