AI圖像生成迎來新霸主!開源模型FLUX.1橫空出世,Midjourney、DALL·E 3緊張了?
FLUX.1,一款由AI圖像生成領域權威專家Robin Rombach推出的開源大模型平臺,以120億參數的Vision Transformer架構,採用流程匹配訓練方法和旋轉位置嵌入等技術,大幅超越了DALL·E3、Midjourney V6等閉源模型及SD3系列。在性能上,FLUX.1在文本語義還原、圖片質量、動作一致性、連貫性和多樣性方面,甚至在文本生成圖片方面均優於主流模型,尤其是其開源的Schnell版本,性能卓越。FLUX.1還計劃推出文生視頻模型,挑戰Sora、Gen-3、Luma等一線產品。其開源特性,讓開發者和AI愛好者在擁有36G以上顯存的電腦上運行AI圖像生成模型成爲可能。FLUX.1的出現,爲開源AI圖像生成領域帶來新希望,加速了AI圖像生成技術的普及和創新,普通用戶有望在家用電腦上體驗媲美甚至超越Midjourney的AI圖像生成模型。