RealFill est un modèle génératif de complétion d'image qui, à l'aide de quelques images de référence du même contexte, permet de combler les zones manquantes d'une image et de générer du contenu visuel cohérent avec la scène d'origine. RealFill crée un modèle génératif personnalisé en affinant un modèle de diffusion de complétion d'image pré-entraîné sur les images de référence et l'image cible. Ce modèle préserve non seulement les bonnes propriétés a priori de l'image, mais il apprend également le contenu, l'éclairage et le style de l'image d'entrée. Ensuite, nous utilisons ce modèle affiné pour remplir les zones manquantes de l'image cible via un processus d'échantillonnage de diffusion standard. RealFill a été évalué sur un nouveau benchmark de complétion d'image comprenant diverses scènes complexes et a démontré des performances largement supérieures aux méthodes existantes.