GenWarp est un modèle permettant de générer des images sous de nouveaux angles de vue à partir d'une seule image. Grâce à un cadre de déformation générative préservant la sémantique, il permet aux modèles de génération d'image à partir de texte d'apprendre où déformer et où générer. Le modèle résout les limites des méthodes existantes en améliorant l'attention croisée entre les points de vue et l'auto-attention. Il conditionne le modèle génératif sur l'image source et intègre des signaux de déformation géométrique, améliorant ainsi les performances dans différents scénarios et domaines.