MiniMax supera o Colossal? O modelo de vídeo Concha do MiniMax é realmente tão poderoso? Resultados de testes...

Nos últimos dias, o modelo de geração de vídeo abab-video-1, lançado pela MiniMax, chamou a atenção no mundo todo. Não apenas os internautas chineses estão animados, mas também os usuários internacionais têm avaliações positivas.

A experiência geral mostra que a geração de vídeo é fácil de usar, bastando inserir uma frase simples para gerar um vídeo fluido. O movimento geral do vídeo é estável e as ações das personagens são muito naturais.

Um influenciador no X chamado "Ryan Morrison" afirmou que o abab-video-1 apresenta a geração de movimentos de mãos mais natural que ele já viu.

Outros influenciadores geraram vídeos de "Star Wars" usando o abab-video-1. Em termos de cores e estética, já tem o "quê" de um filme de Hollywood. Além disso, a filmagem é fluida, com grandes amplitudes de movimento e sem falhas.

Ainda há influenciadores que fizeram uma comparação, afirmando que o abab-video-1 supera o RunwayML em estética e desempenho de vídeo. Será mesmo?

abab-video-1 VS RunwayML: Comparação de Resultados Reais

Abaixo, a AIbase realizou testes com três prompts diferentes. Vamos ver os resultados da comparação!

Teste de Comparação 1: Paisagem Urbana (Prompt Complexo)

Prompt 1: Mostre uma cidade moderna gradualmente retornando ao passado. Os arranha-céus desaparecem lentamente, dando lugar a edifícios antigos; os carros se transformam em carruagens, as pessoas nas ruas usam roupas de épocas passadas. A cidade inteira parece estar viajando no tempo, levando os espectadores a experimentar diferentes épocas.

Vídeo gerado pela AIbase usando o abab-video-1

Podemos ver que o abab-video-1 compreendeu bem o prompt, e a transição gradual entre edifícios antigos e modernos é bastante natural. O desempenho é muito bom.

O mesmo prompt gerou o seguinte resultado no RunwayML:

Vídeo gerado pela AIbase usando o RunwayML

O RunwayML parece ter tido dificuldades em compreender prompts complexos e longos. Pelo vídeo, parece ter compreendido apenas a primeira parte, sem gerar a transformação de edifícios modernos para antigos. Se usássemos imagem para gerar vídeo, o RunwayML provavelmente teria um melhor desempenho.

Teste de Comparação 2: Pessoas em um Bar (Prompt Complexo)

Prompt 2: 5 pessoas sentadas no balcão de um bar, mostrando as flutuações emocionais das 5 pessoas através de mudanças de cor. A imagem deve focar nos rostos, com a cor de fundo mudando de acordo com as expressões. Alegria: cores quentes e brilhantes; Tristeza: tons escuros e frios; Raiva: cores vibrantes e intensas. O fluxo de cores mostra as mudanças sutis de emoção, permitindo que a audiência sinta o mundo interior das personagens.

No prompt 2, a AIbase definiu vários detalhes complexos, como "mudanças de emoção" e "mudanças de tom de fundo de acordo com as emoções", além de aumentar o número de personagens, aumentando a dificuldade.

Vídeo gerado pela AIbase usando o abab-video-1

Aparentemente, o abab-video-1 não teve problemas, a mudança de emoção das personagens é natural, os rostos não estão distorcidos e o tom de fundo muda de acordo com as emoções, com um forte poder expressivo.

Vídeo gerado pela AIbase usando o RunwayML

Com o mesmo prompt, o RunwayML gerou um vídeo com uma personagem a menos, os rostos estão distorcidos e os tons não mudam de acordo com as emoções.

Teste de Comparação 3: Um Casal Sob as Estrelas (Prompt Simples)

Talvez os prompts fossem longos e complexos demais, vamos tentar um prompt mais simples~

Prompt 3: Um casal de mãos dadas caminhando sob um céu estrelado, com a Via Láctea se movendo lentamente ao fundo.

Vídeo gerado pela AIbase usando o abab-video-1

O vídeo gerado pelo abab-video-1 não apresenta problemas, desde a amplitude de movimento até a composição e a estética. O movimento do casal caminhando também é natural.

Vídeo gerado pela AIbase usando o RunwayML

O céu estrelado gerado pelo RunwayML também não apresenta problemas, o único pequeno defeito é que o casal na parte inferior ocupa pouco espaço na imagem, sendo facilmente ignorado. A forma das personagens também está um pouco distorcida, mas ainda aceitável.

Resultados da Comparação

Pelos testes acima, pelo menos na geração de vídeo a partir de texto, o abab-video-1 realmente superou o RunwayML. Atualmente, a vantagem do RunwayML está em suas funções mais ricas, incluindo geração de vídeo a partir de imagem, frames iniciais e finais, etc., com melhor desempenho do que a geração de vídeo a partir de texto. Como o abab-video-1 só gera vídeo a partir de texto, não é possível comparar a geração de vídeo a partir de imagem.

Em resumo, as principais vantagens do abab-video-1 são:

Nível estético: Os vídeos gerados pelo modelo abab-video-1 têm uma melhoria significativa na estética, com combinações de cores mais harmoniosas e composições mais elaboradas.

Movimento da câmera: Em comparação com o RunwayML, o abab-video-1 tem melhor desempenho nas técnicas de filmagem, apresentando transições de imagem e movimentos de câmera mais suaves e naturais.

Expressão facial: O abab-video-1 apresenta modelagem mais rica e delicada das expressões faciais, transmitindo melhor as emoções e a história.

Apresentação de texto: Em cenários que exigem a exibição de texto, o abab-video-1 tem um desempenho melhor, com layout e design de texto mais estéticos e fáceis de ler.

Coerência do vídeo: Os vídeos gerados pelo abab-video-1 têm um desenvolvimento de enredo e transições de imagem mais coerentes, com maior capacidade de storytelling.

Espaço criativo: O abab-video-1 oferece aos criadores um espaço criativo mais amplo, permitindo que eles realizem efeitos visuais e métodos narrativos exclusivos.

Interessados podem experimentar: https://top.aibase.com/tool/hailuowenwen

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Submit Your Model

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

AI Brand Monitoring Tool

GEO Services​

AI Search Visibility Checker

AI Model Compatibility Checker

AI Deployment Calculator

AI Dataset Collection

Intelligent Document Recognition

MiniMax supera o Colossal? O modelo de vídeo Concha do MiniMax é realmente tão poderoso? Resultados de testes...

AIbase基地

Este artigo é do AIbase Daily

Notícias de IA Relacionadas Recomendadas

20 mil dólares para um substituto de tarefas domésticas? O robô humanoide 1X Neo, financiado pela OpenAI, começa a pré-venda e entra nas casas norte-americanas no próximo ano

Hunyuan lança o primeiro podcast de IA interativo no país, os usuários podem fazer perguntas a qualquer momento

Amazon Cloud planeja investir mais 5 bilhões de dólares na Coreia do Sul para impulsionar a construção de centrais de dados de inteligência artificial

Diário de IA: Douyu lança sistema automático de dublagem em grupo; Adobe Firefly Image 5 atualizado significativamente; SoulX-Podcast, modelo de voz da Soul, é lançado

Qualcomm entra no mercado de data centers! Lança os chips AI200/AI250 com objetivo de enfrentar a NVIDIA, ações subiram mais de 20% em um dia

Magic Leap anuncia parceria reatada com o Google para desenvolver protótipos de óculos AR da próxima geração

Tsinghua e Kuaishou lançam um novo modelo de difusão SVG, eficiência de treinamento aumenta 6200%

NVIDIA lança design revolucionário para centro de dados de IA, impulsionando cálculo de alto desempenho

Vice-presidente do Douyin, Li Liang, diz que a IA torna a difamação mais fácil e a plataforma está usando agentes inteligentes para combater falsas notícias

Revolução dos podcasts com IA! Doubao lança sistema automático de voz múltipla 98% de precisão na identificação de personagens, rivalizando com dramas de rádio profissionais

GEO Services