Recentemente, a empresa israelense de tecnologia Lightricks lançou a versão mais recente do seu modelo de geração de vídeo baseado em inteligência artificial open source — o modelo refinado LTX-Video-13B (LTXV-13B v0.9.7-distilled), que possui 13 bilhões de parâmetros. Com técnicas avançadas de renderização em múltiplos escalas e otimizações eficientes de quantificação, este modelo pode gerar vídeos com alta definição em apenas 10 segundos, marcando um novo marco no campo da geração de vídeo por IA. O AIbase analisou profundamente essa inovação revolucionária, levando você a conhecer seus destaques tecnológicos e impacto no setor.

image.png

Endereço do projeto: https://github.com/Lightricks/LTX-Video

Endereço do modelo: https://huggingface.co/spaces/Lightricks/ltx-video-distilled

Inovação tecnológica: Geração de vídeos HD em 10 segundos

O modelo refinado LTX-Video-13B utiliza uma técnica avançada de renderização em múltiplos escalas, refinando gradualmente esboços em baixa resolução até atingir alta qualidade visual, reduzindo significativamente o tempo de geração de vídeos. De acordo com o AIbase, este modelo pode gerar vídeos na resolução de 1216×704 em GPUs de consumo como a NVIDIA RTX4090 em menos de 10 segundos, acelerando cerca de cinco vezes em comparação com a geração anterior. Além disso, pré-visualizações em baixa resolução podem ser concluídas em apenas 3 segundos. Essa quebra de velocidade torna a geração de vídeo em tempo real possível, oferecendo aos criadores uma experiência de eficiência sem precedentes.

Além disso, o modelo suporta edição de quadros-chave, controle de movimento da câmera e sequências de múltiplos ângulos, proporcionando maior liberdade criativa aos usuários. Seja para gerar cenas dinâmicas ou ações complexas de personagens, o LTXV-13B pode apresentar trajetórias de movimento mais fluidas e detalhes mais claros, com qualidade de vídeo comparável ao de produções profissionais cinematográficas.

Open Source Empoderando: Mesmo dispositivos de baixo desempenho podem criar vídeos por IA

Como um modelo completamente open source, o LTX-Video-13B refinado reflete o compromisso da Lightricks com a democratização da tecnologia. O AIbase observou que o modelo introduziu versões quantizadas (fp8) e adaptadas com LoRA, reduzindo significativamente os requisitos de hardware. Mesmo em dispositivos de baixa memória gráfica, os usuários podem executar o modelo para gerar vídeos de alta qualidade. Esta característica é especialmente útil para criadores independentes e pequenas empresas, reduzindo significativamente os custos de produção de vídeos por IA.

O modelo está disponível para download no Hugging Face e no GitHub, além de oferecer suporte compatível via ComfyUI, permitindo que desenvolvedores integrem facilmente o modelo em fluxos de trabalho existentes. A Lightricks também oferece licenças gratuitas para empresas com receita anual inferior a 10 milhões de dólares, promovendo ainda mais a popularização da tecnologia de geração de vídeo por IA.

Eficiência e Qualidade ao Mesmo Tempo: O Segredo de uma Melhoria de 30x na Velocidade

O modelo refinado LTX-Video-13B não só impressiona pela velocidade surpreendente, mas também eleva consideravelmente a qualidade dos vídeos gerados. Graças à colaboração com plataformas como Shutterstock e Getty Images, o modelo foi treinado em conjuntos de dados de vídeos de alta qualidade, resultando em imagens de vídeo com maior sensação cinematográfica e maior coerência nas cenas. O AIbase descobriu que seu núcleo técnico UEfficient Q8 otimiza o desempenho do modelo em hardware de consumo, garantindo que ele funcione de forma eficiente até mesmo em notebooks comuns.

Comparado a modelos semelhantes, a geração do LTXV-13B é 30 vezes mais rápida, com uma média de apenas 37,59 segundos por vídeo, enquanto concorrentes podem precisar de quase 25 minutos em hardware equivalente. Esse salto de eficiência revela um enorme potencial para cenários como geração em tempo real e VTubing (streamers virtuais).

Impacto Industrial: O Desafio às Grandes Potências como OpenAI e Google

O lançamento desta vez pela Lightricks foi considerado uma forte ameaça aos modelos de gigantes como o Sora da OpenAI e o Veo da Google. O AIbase acredita que o LTX-Video-13B refinado demonstra a capacidade de inovação das comunidades open source e das pequenas e médias empresas do setor de IA, conseguindo desempenho comparável a modelos de elite com custos de treinamento muito menores (apenas milhões de dólares). Suas contribuições open source, como a renderização em múltiplos escalas e o modelo VACE, também injetam nova energia no desenvolvimento global da geração de vídeos por IA.

Para os criadores, o aparecimento do LTXV-13B significa que eles podem produzir animações, curtas-metragens ou vídeos de marketing de alta qualidade sem equipamentos profissionais caros. O AIbase prevê que esse modelo acelerará a disseminação de ferramentas de geração de vídeo por IA nos setores de cinema, publicidade e mídias sociais, remodelando o ecossistema da criação de conteúdo.

O Momento "Deepseek" da Geração de Vídeos por IA

Como uma mídia especializada em IA, o AIbase acredita que o lançamento do modelo refinado LTX-Video-13B não é apenas o ápice técnico da Lightricks, mas também uma vitória coletiva da comunidade open source. Sua capacidade de geração ultrarrápida e barreiras de hardware baixas rompem os limites tecnológicos da geração de vídeo por IA, permitindo que mais pessoas participem da criação inteligente.