Hoy, Shengshu Technology de Beijing anuncia el lanzamiento global de Vidu, su modelo de generación de video con IA. Vidu es un modelo que utiliza la inteligencia artificial para generar videos a partir de texto o imágenes.

微信截图_20240730115537.png

En abril de este año, Shengshu Technology y la Universidad Tsinghua lanzaron conjuntamente "Vidu", el primer gran modelo de video de China, marcando un paso importante para China en la tecnología de generación de video.

"Vidu" utiliza la arquitectura U-ViT, de creación propia del equipo, que integra las tecnologías Diffusion y Transformer. Este innovador gran modelo de video puede generar rápidamente videos de alta definición de 1080P con una duración de hasta 16 segundos, mostrando una gran imaginación y creatividad mientras simula el mundo físico real. Su capacidad de generación de múltiples tomas y su consistencia espacio-temporal son características notables de "Vidu".

Desde su lanzamiento, "Vidu" ha logrado avances significativos a nivel mundial, alcanzando un nivel de rendimiento internacionalmente superior y continúa iterándose y optimizándose. Este logro se debe a la profunda acumulación del equipo en el aprendizaje automático bayesiano y en los grandes modelos multimodales, así como a varios resultados originales.

Gracias a su profundo conocimiento de la arquitectura U-ViT y a su amplia experiencia en ingeniería y datos, el equipo superó rápidamente los desafíos tecnológicos clave en la representación y el procesamiento de videos largos, desarrollando con éxito el gran modelo de video "Vidu". "Vidu" ha logrado resultados notables en la mejora de la coherencia y el dinamismo de los videos, impulsando el desarrollo de la tecnología de procesamiento de video.

Enlace de prueba: https://www.vidu.studio/