Nos últimos dias, o modelo de geração de vídeo abab-video-1, lançado pela MiniMax, chamou a atenção no mundo todo. Não apenas os internautas chineses estão animados, mas também os usuários internacionais têm avaliações positivas.

A experiência geral mostra que a geração de vídeo é fácil de usar, bastando inserir uma frase simples para gerar um vídeo fluido. O movimento geral do vídeo é estável e as ações das personagens são muito naturais.

Um influenciador no X chamado "Ryan Morrison" afirmou que o abab-video-1 apresenta a geração de movimentos de mãos mais natural que ele já viu.

MiniMax1.jpg

Outros influenciadores geraram vídeos de "Star Wars" usando o abab-video-1. Em termos de cores e estética, já tem o "quê" de um filme de Hollywood. Além disso, a filmagem é fluida, com grandes amplitudes de movimento e sem falhas.

MiniMax3.jpg

Ainda há influenciadores que fizeram uma comparação, afirmando que o abab-video-1 supera o RunwayML em estética e desempenho de vídeo. Será mesmo?

abab-video-1 VS RunwayML: Comparação de Resultados Reais

Abaixo, a AIbase realizou testes com três prompts diferentes. Vamos ver os resultados da comparação!

Teste de Comparação 1: Paisagem Urbana (Prompt Complexo)

Prompt 1: Mostre uma cidade moderna gradualmente retornando ao passado. Os arranha-céus desaparecem lentamente, dando lugar a edifícios antigos; os carros se transformam em carruagens, as pessoas nas ruas usam roupas de épocas passadas. A cidade inteira parece estar viajando no tempo, levando os espectadores a experimentar diferentes épocas.

Vídeo gerado pela AIbase usando o abab-video-1

Podemos ver que o abab-video-1 compreendeu bem o prompt, e a transição gradual entre edifícios antigos e modernos é bastante natural. O desempenho é muito bom.

O mesmo prompt gerou o seguinte resultado no RunwayML:

Vídeo gerado pela AIbase usando o RunwayML

O RunwayML parece ter tido dificuldades em compreender prompts complexos e longos. Pelo vídeo, parece ter compreendido apenas a primeira parte, sem gerar a transformação de edifícios modernos para antigos. Se usássemos imagem para gerar vídeo, o RunwayML provavelmente teria um melhor desempenho.

Teste de Comparação 2: Pessoas em um Bar (Prompt Complexo)

Prompt 2: 5 pessoas sentadas no balcão de um bar, mostrando as flutuações emocionais das 5 pessoas através de mudanças de cor. A imagem deve focar nos rostos, com a cor de fundo mudando de acordo com as expressões. Alegria: cores quentes e brilhantes; Tristeza: tons escuros e frios; Raiva: cores vibrantes e intensas. O fluxo de cores mostra as mudanças sutis de emoção, permitindo que a audiência sinta o mundo interior das personagens.

No prompt 2, a AIbase definiu vários detalhes complexos, como "mudanças de emoção" e "mudanças de tom de fundo de acordo com as emoções", além de aumentar o número de personagens, aumentando a dificuldade.

Vídeo gerado pela AIbase usando o abab-video-1

Aparentemente, o abab-video-1 não teve problemas, a mudança de emoção das personagens é natural, os rostos não estão distorcidos e o tom de fundo muda de acordo com as emoções, com um forte poder expressivo.

Vídeo gerado pela AIbase usando o RunwayML

Com o mesmo prompt, o RunwayML gerou um vídeo com uma personagem a menos, os rostos estão distorcidos e os tons não mudam de acordo com as emoções.

Teste de Comparação 3: Um Casal Sob as Estrelas (Prompt Simples)

Talvez os prompts fossem longos e complexos demais, vamos tentar um prompt mais simples~

Prompt 3: Um casal de mãos dadas caminhando sob um céu estrelado, com a Via Láctea se movendo lentamente ao fundo.

Vídeo gerado pela AIbase usando o abab-video-1

O vídeo gerado pelo abab-video-1 não apresenta problemas, desde a amplitude de movimento até a composição e a estética. O movimento do casal caminhando também é natural.

Vídeo gerado pela AIbase usando o RunwayML

O céu estrelado gerado pelo RunwayML também não apresenta problemas, o único pequeno defeito é que o casal na parte inferior ocupa pouco espaço na imagem, sendo facilmente ignorado. A forma das personagens também está um pouco distorcida, mas ainda aceitável.

Resultados da Comparação

Pelos testes acima, pelo menos na geração de vídeo a partir de texto, o abab-video-1 realmente superou o RunwayML. Atualmente, a vantagem do RunwayML está em suas funções mais ricas, incluindo geração de vídeo a partir de imagem, frames iniciais e finais, etc., com melhor desempenho do que a geração de vídeo a partir de texto. Como o abab-video-1 só gera vídeo a partir de texto, não é possível comparar a geração de vídeo a partir de imagem.

Em resumo, as principais vantagens do abab-video-1 são:

Nível estético: Os vídeos gerados pelo modelo abab-video-1 têm uma melhoria significativa na estética, com combinações de cores mais harmoniosas e composições mais elaboradas.

Movimento da câmera: Em comparação com o RunwayML, o abab-video-1 tem melhor desempenho nas técnicas de filmagem, apresentando transições de imagem e movimentos de câmera mais suaves e naturais.

Expressão facial: O abab-video-1 apresenta modelagem mais rica e delicada das expressões faciais, transmitindo melhor as emoções e a história.

Apresentação de texto: Em cenários que exigem a exibição de texto, o abab-video-1 tem um desempenho melhor, com layout e design de texto mais estéticos e fáceis de ler.

Coerência do vídeo: Os vídeos gerados pelo abab-video-1 têm um desenvolvimento de enredo e transições de imagem mais coerentes, com maior capacidade de storytelling.

Espaço criativo: O abab-video-1 oferece aos criadores um espaço criativo mais amplo, permitindo que eles realizem efeitos visuais e métodos narrativos exclusivos.

Interessados podem experimentar: https://top.aibase.com/tool/hailuowenwen