Lightricks anuncia que su modelo de generación de videos de inteligencia artificial LTX-Video (LTXV) ha recibido una importante actualización, ahora admite la generación de contenido de imágenes a videos de hasta 60 segundos. Este avance rompe el límite habitual de 8 segundos en la industria, convirtiendo a LTXV en el primer modelo de código abierto capaz de generar videos de IA a largo plazo en tiempo real.

image.png

Generación de videos de 60 segundos: un salto de las cortas películas a narrativas extensas

La última versión de LTXV logra generar videos de alta calidad de hasta 60 segundos a partir de una sola imagen mediante la introducción de una arquitectura de flujo autoregresivo. A diferencia de los modelos tradicionales que producen contenidos de corta duración, LTXV puede transmitir en tiempo real el video durante su generación. El contenido del primer segundo aparece casi instantáneamente, y luego se sigue construyendo la escena continuamente. Esta tecnología no solo permite la generación de videos más largos, sino que también garantiza la continuidad suave de las acciones y la narrativa, brindando a los creadores un espacio inédito para expresar sus historias.

Los usuarios pueden generar videos con resoluciones de 768x512 o superiores (como 1216x704) y con una frecuencia de cuadros de 24FPS, introduciendo indicaciones de texto detalladas junto con una imagen inicial. La tecnología de renderizado multiscala de LTXV captura primero las acciones básicas a baja resolución y luego mejora progresivamente los detalles, asegurando el equilibrio óptimo entre velocidad y calidad.

Control en tiempo real y flexibilidad en la creación

La actualización del modelo LTXV introduce la función de control dinámico de escenas, permitiendo a los usuarios ajustar elementos como posturas, profundidad o estilo en tiempo real durante la generación del video. Gracias a la tecnología IC-LoRA de Lightricks, los creadores pueden aplicar continuamente señales de control (como detección de posturas o bordes), logrando un control preciso sobre los detalles del video. Esta capacidad de "dirigir mientras se genera" transforma a LTXV de una herramienta de generación de indicaciones únicas en una plataforma real para narrativas extensas.

Además, LTXV admite varios modos de generación, incluyendo texto a video, imagen a video, animación de fotogramas clave y extensión de video. Los usuarios incluso pueden combinar varias imágenes o fragmentos de videos cortos como condiciones para generar contenido complejo. Esta flexibilidad lo hace adecuado para una amplia gama de escenarios, desde videos cortos para redes sociales hasta contenido educativo interactivo e incluso efectos visuales en realidad aumentada en tiempo real.

Eficiencia y código abierto: potenciando a una amplia gama de creadores

Otro punto destacado de LTXV es su eficiencia y amabilidad con el hardware. Gracias a su arquitectura de modelo de 13 mil millones de parámetros y optimizaciones en precisión bfloat16, LTXV puede ejecutarse en tarjetas gráficas de consumo (como NVIDIA RTX4090 o 5090) con un requerimiento mínimo de VRAM (mínimo 8 GB), generando videos de 60 segundos en unos pocos segundos. Por ejemplo, en una GPU H100, LTXV puede generar un video de 5 segundos en 4 segundos, más rápido que la reproducción en tiempo real. En comparación, modelos competidores como Sora de OpenAI normalmente requieren soporte de múltiples GPUs, lo que implica costos computacionales elevados.

Como modelo de código abierto, el código y los pesos de LTXV están disponibles gratuitamente en GitHub y Hugging Face, bajo la licencia LTXV Open Weights License, apoyando así investigaciones académicas y desarrollo comunitario. Lightricks también ha lanzado herramientas complementarias, como LTX-Video-Trainer y flujos de trabajo integrados con ComfyUI, reduciendo aún más la barrera de entrada.

Impacto en la industria y perspectivas futuras

Esta actualización de Lightricks lleva la generación de videos de inteligencia artificial a nuevas alturas. La capacidad de generar videos de 60 segundos no solo brinda a creadores independientes, equipos de marketing y desarrolladores de juegos la habilidad de crear contenido extenso rápidamente, sino que también establece la base para aplicaciones interactivas en tiempo real, como visuales de realidad aumentada dinámica o secuencias de juego impulsadas por jugadores.

Los comentarios en redes sociales muestran que los usuarios elogian la velocidad y la calidad de LTXV. Por ejemplo, un usuario señaló que generar un video de 768x512 en una RTX4080 tomó solo 45 segundos, y el resultado del video de 60 segundos fue impresionante, aunque algunos usuarios mencionaron que aún se necesita optimizar el flujo de trabajo.

No obstante, las limitaciones para uso no comercial (solo para fines académicos y de investigación) podrían representar un desafío para ciertos creadores comerciales. Lightricks indicó que en su plataforma principal, LTX Studio, lanzará una versión comercial que admita videos de 60 segundos, ampliando aún más las aplicaciones.

AIbase considera que la actualización de LTXV redefine las posibilidades de la creación de videos de inteligencia artificial. Su estrategia de código abierto y rendimiento eficiente acelerarán la innovación en la industria. Con el futuro optimización del modelo, LTXV podría ocupar un lugar importante en la producción cinematográfica profesional y la generación de contenido en tiempo real.