バイトダンスと中国科学技術大学が開発!VMix:拡散モデルの美学を向上させるプラグアンドプレイ拡張
テキストから画像を生成する分野において、拡散モデルは比類のない能力を示していますが、美的画像生成においては依然として課題が残っています。最近、バイトダンスと中国科学技術大学は、生成画像の品質を向上させ、様々な視覚概念に対する汎用性を維持することを目的とした、新しい技術「Cross-Attention Value Mixing Control(VMix)アダプター」を発表しました。VMixアダプターの核心は、優れた条件制御を設計することにあります。