テキストから画像生成蒸留の高速化と効率化

最近、Googleとジョンズ・ホプキンス大学の研究者らが、より高速で効率的なテキストから画像への生成蒸留手法を発表しました。

大規模データで訓練されたテキストから画像への拡散モデルは、その高品質で多様な生成結果から、生成タスクにおいて主導的な地位を占めています。この研究では、無条件事前学習から始まり、最終的に条件付き拡散モデルを蒸留する、シングルステージの蒸留手法を紹介しています。

実験により、この革新的な蒸留技術は、視覚的な品質と定量的な性能の両方において、従来の手法を上回ることが示されました。