Baidu ha lanzado UniVG, un modelo de generación de video. Para tareas de alta y baja libertad, emplea diferentes métodos de generación, mostrando un rendimiento excepcional en la base de datos de video MSR-VTT. Admite diversas combinaciones de entrada de texto e imágenes.

UniVG utiliza la atención cruzada multicriterio y ruido gaussiano sesgado, lo que le confiere innovación y valor práctico.