最好的MMDiT AI工具模型_精選MMDiT資訊

AI資訊

通義千問重磅開源Qwen-Image：20B參數MMDiT模型全面刷新圖像生成SOTA

通義千問開源20B參數圖像生成模型Qwen-Image，採用創新MMDiT架構實現三大突破：1）卓越文本渲染能力，精準處理中英文混排；2）一致性圖像編輯技術，保持原圖風格精準修改；3）跨基準全面領先，在GenEval等測試中表現優異。該模型支持海報設計、排版規劃等專業應用，具備多樣化藝術風格創作能力。通過魔搭社區和Hugging Face完全開源，降低視覺創作門檻，推動生成式AI生態發展，標誌着圖像生成技術進入新階段。

14.9k 5 天前

阿里通義千問開源全新文生圖模型Qwen-Image

通義千問系列首次開源了一款名爲Qwen-Image的20億參數多模態擴散變換器（MMDiT）圖像生成基礎模型。這一創新成果不僅在複雜文本渲染和精確圖像編輯方面取得了突破性進展，更是在多個公開基準測試中展現了卓越性能，成爲圖像生成與編輯領域的新星。 Qwen-Image以其強大的文本渲染能力脫穎而出，支持多行佈局、段落級文本生成及細粒度細節呈現，無論是英語還是中文，均能實現高保真輸出。例如，在渲染宮崎駿風格的動漫場景時，模型能夠精準呈現店鋪牌匾、人物姿勢及神態，甚至酒缸上的細小文字也清晰可見。同樣，在中文對聯的渲染中，Qwen-Image不僅準確繪

18.4k 4 天前

階躍星辰發佈圖像生成模型Step-1X-Medium 支持圖生圖等新功能

上海階躍星辰智能科技有限公司近日宣佈，其圖像生成模型Step-1X系列迎來了重大升級，推出了性能更優的Step-1X-Medium版本。這一升級版本在多個方面實現了顯著提升:基於MMDit架構，生成速度提高了30%以上;經過針對性訓練，新版本在理解能力和圖文一致性方面更強，生成的畫面細節質感更加自然。

15.1k 1 天前

免費開放商用！Stability AI推輕量級AI繪畫利器 Stable Diffusion 3.5 Medium模型

Stability AI再次突破技術壁壘，推出全新Stable Diffusion3.5Medium模型。這款面向大衆的AI繪畫工具不僅完全免費開放商用，更重要的是實現了高性能與普及性的完美平衡。這款採用多模態擴散變換器（MMDiT-X）架構的模型，以25億參數的精簡設計，巧妙解決了普通用戶的硬件門檻問題。僅需9.9GB顯存，便能在大多數消費級顯卡上流暢運行，真正實現了"人人可用"的願景。在技術創新方面，該模型整合了三種預訓練文本編碼器，並引入QK標準化技術提升訓練穩定性。特別值得一提的是，其前12個變換層

18.5k 1 天前