Volcán Engine ha lanzado oficialmente la capacidad de marco inicial y final del modelo de generación de video Doubao-Seedance-1.0-pro (Doubao-Seedance-1.0-pro), esta actualización marca un importante avance en la controlabilidad y coherencia de la creación de videos con inteligencia artificial. Gracias a ventajas técnicas como la coherencia de los sujetos en escenas complejas, la racionalidad física de movimientos amplios y el razonamiento inteligente sobre el ritmo del video, Seedance 1.0 pro mejorará significativamente el efecto de seguimiento del protagonista en los videos generados, permitiendo una guía narrativa precisa y produciendo obras de video más inmersivas y expresivas.
Los usuarios empresariales pueden acceder a la capacidad de marco inicial y final del modelo mediante la API de Seedance 1.0 pro a través de Volcán Ark, mientras que los usuarios individuales pueden experimentar directamente en "Centro de Experiencia de Volcán Ark". La introducción de esta capacidad no solo brinda a los creadores profesionales de imágenes poderosas herramientas, sino que también abre nuevas puertas para el uso común de la creación de videos con inteligencia artificial.
La capacidad de marco inicial y final de Seedance 1.0 pro desempeña un papel importante en la narración cinematográfica. Su principal ventaja radica en su capacidad para mejorar la comprensión estructurada del "sujeto narrativo", fijar las características del personaje principal y mantener la coherencia doble de la lógica física y la presentación visual durante la generación dinámica. Por ejemplo, en escenas complejas, el modelo puede identificar con precisión las caras humanas como "puntos de anclaje de generación", manteniendo al sujeto sin distorsión ni desplazamiento, con transiciones muy suaves y representando con precisión microexpresiones. Además, en escenas complejas con espejos, agua o vidrio, Seedance 1.0 pro puede reproducir con exactitud los detalles del sujeto.
En escenas con movimientos amplios, Seedance 1.0 pro puede capturar con precisión las trayectorias del movimiento corporal, manteniendo la continuidad y la racionalidad de los movimientos, mostrando las leyes reales del movimiento físico. Ya sea el correr, saltar o nadar de un niño pequeño, o diferentes acciones de múltiples personas en escenas de grupo, el modelo garantiza que las direcciones de los movimientos sean claras y lógicas, sirviendo todas juntas al relato general.
Seedance 1.0 pro también posee una capacidad de comprensión semántica profunda, lo que permite que el ritmo general del video fluya natural y fluidamente. Por ejemplo, cuando una pared se rompe repentinamente y mucha agua entra en la bodega de un barco, las olas golpean y se revuelven de acuerdo con la lógica física y la conexión con los contenedores también sigue el cambio en el ritmo del video.
Esta innovación de Volcán Engine no solo impulsa el desarrollo de la creación de videos con inteligencia artificial, sino que también ofrece a los creadores un espacio infinito de perspectivas y creatividad.