智譜AI、新モデルをオープンソース化、古いグラフィックボードでも動画生成の新時代へ
智譜AIは、動画生成モデルCogVideoX-5Bをオープンソース化しました。これにより、動画生成の品質、視覚効果、推論性能が大幅に向上します。新しいモデルは、GTX1080Tiなどの比較的低スペックなGPUや、デスクトップ版RTX3060にも対応しています。大規模DiTモデルをベースにしたこのツールは、3D因果変分オートエンコーダと専門家変換器技術を採用し、3D-RoPE位置エンコーディングと3D全アテンション機構によって、効率的なテキストから動画への生成を実現します。詳細情報とコードは、指定のリンクからアクセスできます。