O CogVideo é um modelo de geração de vídeo a partir de texto desenvolvido pela equipe da Universidade Tsinghua. Ele utiliza técnicas de aprendizado profundo para converter descrições de texto em conteúdo de vídeo. Essa tecnologia apresenta amplas perspectivas de aplicação em criação de conteúdo de vídeo, educação e entretenimento. O modelo CogVideo, por meio de pré-treinamento em larga escala, consegue gerar vídeos que correspondem às descrições de texto, oferecendo uma nova forma automatizada de produção de vídeos.