智谱AI推出新一代视频生成模型CogVideoX 可通过「清影」免费体验
智谱AI发布新一代视频生成模型CogVideoX,通过3D VAE结构与3D RoPE模块提升时间维度帧间关系捕捉,增强模型对文本的理解与指令遵循能力,实现文本、时间和空间三维融合的transformer架构,以高效生成符合用户需求的视频。该模型已上线智谱清言平台,支持免费体验文本与图像生成视频服务,其特点是快速生成、高效指令遵循、内容连贯性和画面调度灵活。智谱大模型开放平台bigmodel.cn也提供API调用服务。智谱AI通过此模型验证了Scaling Law在视频生成领域的有效性,并承诺持续扩大数据与模型规模,优化压缩视频信息与融合文本内容的能力。