CustomVideoは、複数のテーマに基づきながら同一性を維持したビデオを生成することを目指した、斬新なフレームワークです。本製品はまず、複数のテーマの同時出現を促進し、その後、基本的なテキストからビデオへの拡散モデルを用いて、シンプルかつ効果的な注意制御戦略を設計することで、拡散モデルの潜在空間において異なるテーマを分離します。さらに、与えられた参照画像からオブジェクトをセグメンテーションし、注意学習に相当するオブジェクトマスクを提供することで、モデルが特定のオブジェクト領域に焦点を当てることを支援します。同時に、69個の個別テーマと57個の意味のあるペアを含む、包括的なベンチマークとして、多テーマテキストからビデオへの生成データセットを収集しました。数多くの定性的、定量的、およびユーザー調査の結果は、従来の最先端の方法と比較して、当社の方法が顕著な優位性を持つことを示しています。