REPA技術將 AI 圖像生成模型的訓練速度提高了 17.5 倍
研究人員最近開發了一種名爲 REPA 的新技術,旨在加速 AI 圖像生成模型的訓練速度。REPA 代表 REPresentation Alignment,通過整合來自 DINOv2等模型的高質量視覺表示來提高訓練速度和輸出質量。傳統的擴散模型通常會創建嘈雜的圖像,然後逐漸將其細化爲乾淨的圖像。REPA 增加了一個步驟,將在此去噪過程中生成的表示與來自 DINOv2的表示進行比較。然後,它將擴散模型的隱藏狀態投影到 DINOv2的表示上。研究人員表示,REPA 不僅提高了訓練效率,還提高了生成的圖像質量。使用各種擴散模型架構