¡No se preocupe si las tarifas de Koling son altas! Ya hay una nueva herramienta gratuita para generar videos. Vidu, el modelo de generación de video de Shengshu Technology, que ha generado mucha expectación, se ha lanzado oficialmente en todo el mundo. Los usuarios pueden registrarse y acceder directamente con su correo electrónico, sin necesidad de esperar la aprobación. Tras el registro exitoso, los usuarios reciben 80 puntos.
Este generador de videos con IA no solo es completo en funciones, sino que también es fácil de usar. Los usuarios pueden generar fácilmente videos de alta definición de 4 o 8 segundos, con una resolución de hasta 1080P, satisfaciendo las necesidades de producción de video de alto estándar.
Puntos clave de Vidu:
Generación rápida: Vidu ha logrado la velocidad de inferencia más rápida del sector, generando un video de 4 segundos en solo 30 segundos, el doble de rápido que la competencia.
Alta fidelidad: Ya sea en estilo anime o realista, Vidu puede generar imágenes vívidas y realistas, con movimientos de personajes naturales y fluidos, sin que los movimientos bruscos causen fallas en la imagen.
Consistencia de personajes: Vidu admite la función de consistencia de personajes. Después de cargar una imagen de un personaje, se puede especificar que dicho personaje realice cualquier acción en cualquier escena, facilitando la creación de memes e imágenes divertidas.
Admite múltiples estilos: Además del estilo realista, Vidu también admite la generación de videos en estilo anime, con un estilo que recuerda al de Hayao Miyazaki, lleno de imaginación.
Conversión directa de texto a video: Gracias a la innovación en la arquitectura subyacente, la sensación de las obras de Vidu es más "de una sola toma", el video se genera de forma continua de principio a fin, sin rastros de interpolación de fotogramas.
Amplias aplicaciones: Desde la creación de juegos y postproducción cinematográfica hasta la educación y la formación, Vidu ofrece un potente soporte.
En comparación con productos como Koling y Luma, las principales características de Vidu son la introducción de las funciones de consistencia de personajes y estilo anime.
Aquí, AIbase utiliza ilustraciones planas generadas previamente para realizar pruebas. Este tipo de imágenes son difíciles de convertir en videos en plataformas como Koling, y los rostros suelen distorsionarse.
La interfaz de usuario de Vidu es sencilla. Solo necesita cargar la imagen y seleccionar su uso. Aquí, no planeo cambiar el fondo original de la imagen, así que la selecciono como fotograma inicial y hago clic en generar.
Indicación: Un niño pequeño chapoteando alegremente en un charco, mientras la lluvia se intensifica.
Resultado de la prueba:
Como se puede ver, Vidu es relativamente mejor que Koling en la generación de videos de estilo anime; el movimiento de los personajes es normal y los personajes apenas se distorsionan. Excepto por el último fotograma, que se desvía un poco de la indicación, la parte anterior es básicamente utilizable.
Para verificar la potencia de Vidu en el estilo anime, AIbase también utilizó un "desafío clásico": un personaje de anime de estilo antiguo para realizar las pruebas. Ayer mismo probé esta imagen con Koling y Luma, y los resultados no fueron satisfactorios. Los personajes de anime de estilo antiguo siempre han sido un desafío para los modelos de generación de video.
Indicación: El chico se ajusta el sombrero con la mano y de repente sonríe.
Resultado de la prueba:
Como se puede observar, el proceso de movimiento del personaje antiguo es bastante fluido en general, y las manos y el rostro apenas se distorsionan. Sin embargo, el personaje se ve ligeramente menos atractivo. En comparación con Koling, es relativamente mejor en la conversión de ilustraciones antiguas a videos.
Vidu también puede manejar fácilmente imágenes de modelos 3D:
Indicación: Un adorable dragón mecánico jugando con burbujas.
Vidu también maneja perfectamente este tipo de personajes de anime de estilo dibujo a mano alzada:
Indicación: Pareja besándose.
Prueba de consistencia de personajes:
Aquí, AIbase selecciona una imagen de una hermosa mujer con tulipanes generada previamente para la prueba:
Resultado de la generación:
Indicación: Una chica con un vestido Hanfu de estilo Song caminando por un callejón en el sur de China.
AIbase probó varios videos y, por ahora, el rendimiento de Vidu en cuanto a la consistencia de los personajes es algo inestable; los videos generados son borrosos y, a veces, los personajes se distorsionan.
Cabe destacar que Vidu, a diferencia de Koling, no admite la ejecución simultánea de varias tareas. Si el video anterior aún no se ha completado, no se puede iniciar la siguiente tarea de generación de video.
Aunque la publicidad oficial afirma que Vidu solo necesita 30 segundos para generar un video de 4 segundos, en las pruebas realizadas por AIbase, la generación de un video tarda al menos 2 o 3 minutos. Sin embargo, es significativamente más rápido que Koling y Luma.
Si está interesado, puede probarlo usted mismo. Dirección del producto: https://top.aibase.com/tool/viduguanwang
Vidu fue desarrollado por un equipo liderado por el profesor Zhu Jun de la Universidad Tsinghua, basado en la arquitectura U-ViT de desarrollo propio. Esta arquitectura es la primera del mundo en integrar Diffusion y Transformer, propuesta antes que la arquitectura DiT utilizada por Sora.
La innovación de Vidu radica en su capacidad para lograr una conversión directa y continua de texto a video, evitando la interpolación y la unión de fotogramas en el procesamiento tradicional de varios pasos, lo que hace que los videos generados sean más fluidos y naturales.
Shengshu Technology se fundó en marzo de 2023. Su equipo está formado por miembros clave del Instituto de Investigación de Inteligencia Artificial de la Universidad Tsinghua, con una sólida experiencia en el desarrollo de grandes modelos multimodales. Desde su fundación en 2023, la empresa ha recibido el reconocimiento de instituciones industriales de renombre como Ant Group y Qiming Venture Partners, y ha completado una ronda de financiación de cientos de millones de yuanes, convirtiéndose en el equipo de nueva creación con mayor valoración en el sector de los grandes modelos multimodales de China.