微軟開源圖片模型ART,可生成多圖層透明圖片
在圖像生成領域,多層圖像生成技術正逐漸改變用戶與生成模型的互動方式,允許用戶隔離、選擇並編輯特定的圖像層。近日,微軟研究人員推出了一種名爲 “Anonymous Region Transformer”(ART)的新型技術,它能夠根據全球文本提示和匿名區域佈局,直接生成可變多層透明圖像。ART 的設計靈感來源於 “圖式理論”,通過採用匿名區域佈局,使生成模型可以自主決定哪些視覺信息與哪些文本信息對齊。這一方法與以往的語義佈局形成鮮明對比。傳統的語義佈局通常需要明確的對應關係,而 ART