GenWarpは、単一の画像から新しい視点の画像を生成するためのモデルです。これは、意味を維持する生成的な変形フレームワークを通じて、テキストから画像への生成モデルがどこを変形し、どこで生成するかを学習できるようにします。本モデルは、既存手法の限界を解決するために、クロスビューアテンションとセルフアテンションを強化し、条件付き生成モデルをソースビュー画像に適用し、幾何学的変形信号を取り入れることで、様々なシナリオにおける性能を向上させています。