A Midjourney lançou oficialmente seu primeiro modelo de geração de vídeo, o V1, marcando um novo marco para esta empresa famosa por sua geração de imagens no campo da criação multimídia. Como uma das principais plataformas de IA criativa global, o lançamento dessa vez atraiu grande atenção dos criadores de arte digital e vídeos. Este artigo, editado pelo departamento editorial da AIbase, reúne as informações mais recentes da internet para explicar detalhadamente os destaques centrais e o potencial futuro do modelo V1.

image.png

De estático a dinâmico: as funções principais do modelo V1

O modelo de geração de vídeo Midjourney V1 foca principalmente na função de imagem para vídeo (Image-to-Video, I2V). Usuários podem transformar imagens estáticas em vídeos dinâmicos clicando no botão "Animate" na interface web. O tempo padrão de geração é de 5 segundos de vídeo curto, e cada geração oferece quatro segmentos de vídeos com diferentes estilos, permitindo que o usuário escolha a versão mais adequada às suas necessidades. Além disso, o tempo de duração pode ser aumentado progressivamente em incrementos de 4 segundos, com um limite máximo de 20 segundos.

O V1 oferece dois modos de movimento:

Modo de baixa dinâmica: ideal para cenas ambientais, onde a câmera permanece relativamente estável e o sujeito se move lentamente ou de forma deliberada, criando uma atmosfera imersiva.  

Modo de alta dinâmica: adequado para cenas com maior ritmo, proporcionando efeitos visuais mais impactantes.

Os usuários podem optar por um modo de animação automática, onde a IA decide o tipo de movimento, ou personalizar manualmente por meio de sugestões de texto, ajustando ainda mais a direção criativa do vídeo. A Midjourney enfatiza que o V1 herda a alta consistência de sua versão anterior de modelo de imagem, garantindo detalhes e estilo de alta qualidade nos vídeos gerados.

Precificação acessível, voltada para uma ampla base de criadores

A Midjourney tem como objetivo custos baixos e alta acessibilidade, e a estratégia de precificação do modelo V1 segue seu estilo amigável. Com apenas US$ 10/mês no plano básico, os usuários já podem experimentar a funcionalidade de geração de vídeo. No entanto, os planos Pro (US$ 60/mês) e Mega (US$ 120/mês) permitem aos usuários desfrutar de gerações ilimitadas em "modo relax". Apesar disso, o custo computacional da geração de vídeo é aproximadamente 8 vezes maior que o da geração de imagem, então os usuários precisam planejar cuidadosamente suas cotas mensais.

Por outro lado, a Midjourney ainda não oferece funcionalidades avançadas como melhoramento de resolução de vídeo ou geração de áudio. Atualmente, a resolução de saída é de 480p, com 24 quadros por segundo. Embora seja um pouco básico comparado a concorrentes como Runway Gen-4, Luma Dream Machine ou Sora da OpenAI, seu baixo custo de entrada e seu estilo visual de alta qualidade ainda lhe conferem uma posição única no mercado.

Visão de futuro: a ambição grandiosa da Midjourney

O CEO da Midjourney, David Holz, afirmou em um blog que o modelo V1 é um passo importante em direção ao objetivo de simulação de mundo aberto em tempo real. Enquanto muitas empresas se concentram em gerar material B-roll simples para Hollywood ou publicidade, a Midjourney se dedica à construção de modelos de IA capazes de gerar simulações interativas 3D. Holz enfatizou: "Precisamos de visuais (modelos de imagem), precisamos fazer com que essas imagens se movam (modelos de vídeo), isso é o alicerce para o futuro."

O lançamento do V1 não apenas representa um avanço tecnológico, mas também injeta nova vitalidade no ecossistema da Midjourney. Com seu mais recente modelo V7 de texto para imagem, os usuários podem gerar imagens a partir de textos e convertê-las diretamente em vídeos, formando um ciclo criativo completo. Esse fluxo de criação end-to-end fornece ferramentas eficientes para criadores independentes, artistas digitais e pequenas empresas.

Desafios e controvérsias: sombras de litígios de direitos autorais

Embora o lançamento do V1 tenha gerado ampla discussão, a Midjourney enfrenta processos de litígio por infração de direitos autorais movidos pela Disney e Universal Pictures. Essas duas gigantes de Hollywood acusam a Midjourney de usar seus ativos intelectuais sem permissão, como personagens de "Star Wars" e "Minions", para treinar seus modelos de IA e gerar imagens e vídeos quase idênticos. Esse processo pode representar um desafio significativo para a expansão dos serviços de vídeo da Midjourney e também serve como um alerta sobre a regulamentação de direitos autorais na indústria de IA generativa.

Feedback dos usuários e resposta do mercado

Com base nos mais recentes comentários online, o modelo V1 foi amplamente elogiado pelos criadores por sua simplicidade operacional e beleza visual. Muitos usuários mencionaram que, mesmo sem entradas de texto complexas, o V1 pode gerar vídeos com sensação de realismo e detalhes refinados, especialmente destacando-se em cenas de baixa dinâmica. No entanto, em cenários de alta dinâmica, podem ocorrer pequenos problemas de piscamento, indicando espaço para otimização técnica.

Simultaneamente, o lançamento do V1 gerou grande repercussão nas redes sociais. Criadores compartilham vídeos gerados pelo V1, demonstrando aplicações variadas, desde paisagens oníricas até cenários de ficção científica. A atividade da comunidade da Midjourney aumentou ainda mais, prevendo-se que atrairá mais novos usuários para a plataforma.

O editor da AIbase acredita que o lançamento do Midjourney V1 não apenas representa um avanço técnico, mas também promove novamente a democratização das ferramentas criativas da IA. Seu custo baixo e qualidade superior tornam possível que mais criadores independentes entrem no campo da criação de vídeo com uma barreira muito baixa. Embora as funcionalidades atuais sejam um pouco básicas, o roteiro claro e a visão ambiciosa da Midjourney indicam que o V1 é apenas o ponto inicial de sua jornada na geração de vídeo.

No futuro, esperamos que a Midjourney traga mais inovações em melhorias de resolução, funcionalidades de texto para vídeo e integração de áudio. Além disso, a resolução de questões relacionadas a direitos autorais será fundamental para seu sucesso contínuo. A AIbase continuará monitorando as atualizações da Midjourney, fornecendo notícias do setor em primeira mão.