RealFillは、少量の参照画像を用いて画像の欠損領域を補完し、元のシーンに合致した視覚コンテンツを生成する画像補完生成モデルです。RealFillは、参照画像と対象画像で事前学習済みの画像補完拡散モデルを微調整することで、パーソナライズされた生成モデルを作成します。このモデルは、良好な画像事前知識を維持しながら、入力画像の内容、照明、スタイルを学習します。その後、この微調整済みのモデルを用いて、標準的な拡散サンプリングプロセスにより対象画像の欠損領域を補完します。RealFillは、様々な複雑なシーンを含む新しい画像補完ベンチマークで評価され、既存手法を大幅に上回る性能を示しました。