李飛飛團隊推出新型圖像處理技術,打破傳統界限
在計算機視覺領域,如何高效地處理圖像一直是研究的熱點話題。近日,斯坦福大學的李飛飛教授和吳佳俊教授的團隊發佈了一項新的研究成果,提出了一種名爲 “FlowMo” 的創新型圖像 tokenizer。這種新方法在不依賴卷積神經網絡(CNN)和生成對抗網絡(GAN)的情況下,顯著提升了圖像重建的質量。當我們看到一張貓咪的照片時,大腦可以瞬間識別出那是一隻貓。然而,對於計算機而言,處理圖像則顯得複雜得多。計算機將圖像視爲龐大的數字矩陣,通常需要數百萬個數字來表示每一個像素