El campo de videos de inteligencia artificial experimenta una gran innovación: el modelo de video Vidu Q1 de Shengshu Technology ha lanzado oficialmente la función de referencia, ofreciendo una experiencia revolucionaria que redefine los límites técnicos y la eficiencia de producción al convertir "de la imaginación a los materiales de video en un solo paso".

En el proceso tradicional de producción de videos, los creadores deben pasar por complejos pasos como redactar guiones, diseñar personajes, dibujar planos secuenciales, filmar en exteriores y editar posteriormente, lo que hace que la creación de una corta película tome semanas o incluso meses. La introducción de la función Vidu Q1 "Reference Generator" rompe completamente este patrón establecido. Los usuarios solo necesitan subir imágenes de personajes, accesorios y escenas, y el sistema puede generar en minutos materiales de video integrados con múltiples elementos, logrando así "generación sin guiones". Por ejemplo, al ingresar dos imágenes de personajes vaqueros, dos escenas y dos pistolas, se puede generar directamente una escena cinematográfica de un duelo western, con paisajes amplios, primeros planos y progresión de la trama en un solo movimiento, sin necesidad de ningún diseño manual de planos secuenciales.

微信截图_20250708173704.png

Esta innovación no solo simplifica el proceso de creación, sino que también otorga a los creadores una flexibilidad inigualable. La biblioteca de materiales subidos actúa como un "equipo virtual", permitiendo a los usuarios combinar libremente personajes, escenas y accesorios, y cambiar elementos individuales para lograr transiciones fluidas en la narrativa visual. Por ejemplo, un mismo personaje vaquero puede estar corriendo por la pradera en un momento, y al siguiente instante ya está sentado en un bar tomando una copa de una dama, con la trama avanzando naturalmente y las relaciones entre los personajes desarrollándose capa por capa.

En cuanto a aplicaciones comerciales, la función "Reference Generator" de Vidu Q1 demuestra una alta adaptabilidad. Para requisitos estrictos de consistencia del sujeto en sectores como comercio electrónico, publicidad y desarrollo de IP, esta función permite ingresar hasta 7 sujetos simultáneamente y garantiza una alta coherencia en escenas como interacciones entre múltiples personajes y presentaciones de productos. Por ejemplo, una marca puede hacer que "Anne Hathaway" promocione diferentes productos, desde un Tesla rosa hasta una bebida de Mcdonald's, manteniendo siempre detalles precisos de los productos, y el costo de un video de 5 segundos en resolución 1080P es solo de 9 décimos de dólar, equivalente a 1/30 del costo de material de derechos de autor tradicional. Si se genera material para un episodio de 48 minutos de una serie de televisión, el costo es de aproximadamente mil dólares, con una relación calidad-precio muy superior a los materiales de derechos de autor personalizados.