智譜AI宣佈將其視頻生成模型CogVideoX開源,旨在推動視頻生成技術的快速發展和應用。CogVideoX模型基於先進的大型模型技術,能夠滿足商業級應用的需求。目前開源的CogVideoX-2B版本在FP-16精度下的推理僅需18GB顯存,微調則需要40GB顯存,使得單張4090顯卡即可進行推理,而單張A6000顯卡即可完成微調。
一個開源的視頻生成模型,用於創造生動的視頻內容。
Chatglm
-
輸入tokens/百萬
輸出tokens/百萬
上下文長度
Fudan-FUXI
CogVideoX-2B-LiFT是基於獎勵加權學習方法對CogVideoX-1.5進行微調的文本到視頻生成模型
NimVideo
基於千萬級視頻數據微調的圖像到視頻生成模型,生成質量媲美CogVideoX-5B的SBS級別水準
Zlikwid
這是一個為THUDM/CogVideoX-2b訓練的LoRA權重模型,專注於文本生成視頻任務
rttrsabc
CogVideoX是源自清影的視頻生成模型的開源版本,2B版本為入門級模型,平衡兼容性,運行和二次開發成本低。
bertjiazheng
KoolCogVideoX-2b是基於CogVideoX-2B微調的模型,專為室內設計場景優化的文本生成視頻模型。
THUDM
CogVideoX是源自清影的開源視頻生成模型,2B版本是入門級模型,平衡兼容性,運行和二次開發成本低。
zai-org
CogVideoX-2B是一個20億參數的視頻生成模型,能夠根據文本輸入生成對應的視頻內容。該模型在成本和兼容性上取得了良好平衡,支持多種優化技術,適用於多種視頻生成場景。