智譜AI推出新一代視頻生成模型CogVideoX 可通過「清影」免費體驗
智譜AI發佈新一代視頻生成模型CogVideoX,通過3D VAE結構與3D RoPE模塊提升時間維度幀間關係捕捉,增強模型對文本的理解與指令遵循能力,實現文本、時間和空間三維融合的transformer架構,以高效生成符合用戶需求的視頻。該模型已上線智譜清言平臺,支持免費體驗文本與圖像生成視頻服務,其特點是快速生成、高效指令遵循、內容連貫性和畫面調度靈活。智譜大模型開放平臺bigmodel.cn也提供API調用服務。智譜AI通過此模型驗證了Scaling Law在視頻生成領域的有效性,並承諾持續擴大數據與模型規模,優化壓縮視頻信息與融合文本內容的能力。