Shengshu Technology anunció hoy que la función de generación de imágenes basada en referencias de su modelo de video Vidu Q1 está ahora disponible para usuarios públicos. El lanzamiento de esta función tiene como objetivo superar el cuello de botella de la tecnología de coherencia entre múltiples sujetos, cerrar la cadena de producción comercial de generación de imágenes y videos con IA, y impulsar la creación multimodal de IA a una nueva etapa.

QQ20250909-142106.png

El lanzamiento de la función de generación de imágenes basada en referencias de Vidu Q1 se centra en "cinco destacadas características". En primer lugar, admite la entrada de hasta siete imágenes de referencia simultáneamente, lo que mejora significativamente el control durante el proceso de creación. En segundo lugar, Vidu Q1 muestra una mayor coherencia en la capacidad de generación de múltiples sujetos y escenarios, asegurando que las apariencias y características de las personas y los sujetos permanezcan consistentes incluso en múltiples generaciones, garantizando una alta fidelidad y realismo. Además, los usuarios solo necesitan proporcionar una imagen y una palabra clave para cambiar libremente la ropa y el fondo, logrando una creación de alta libertad.

Shengshu Technology indicó que la era de múltiples imágenes de referencia de Vidu Q1 representa un gran avance en la tecnología de coherencia, permitiendo a los usuarios crear de manera flexible en escenas complejas, mejorando la autenticidad y aplicabilidad de la generación de imágenes. Anteriormente, las herramientas de creación de IA se enfocaban principalmente en estimular la inspiración, mientras que Vidu Q1 expandió el papel de la IA al ser el principal responsable de la producción de contenido, permitiendo a los usuarios supervisar solo, reduciendo enormemente la barrera de producción de contenido.

QQ20250909-142136.png

En cuanto a las aplicaciones específicas, Vidu Q1 ofrece tres modos de generación: síntesis, reemplazo y transformación. Por ejemplo, los usuarios pueden sintetizar a diferentes personas en la misma escena o cambiar el fondo de una fotografía existente por una nueva escena, generando así contenido personalizado de manera sencilla. Además, esta herramienta tiene un gran potencial en campos como el diseño de ropa, la publicidad, el marketing creativo, ayudando a diseñadores y comerciantes electrónicos a producir rápidamente materiales de alta calidad.

La innovación de Shengshu Technology marca un nuevo hito en la aplicación comercial de las herramientas de generación de imágenes con IA. La empresa espera mediante esta tecnología avanzada impulsar a más empresas y usuarios individuales del sector a iniciar una nueva era de creación multimodal, logrando realmente el objetivo de que la tecnología de IA impulse la productividad.