最好的Diffusers AI工具模型_精選Diffusers資訊 - AIBase

AI資訊

新模型 CoMPaSS-FLUX.1：提升Flux文本到圖像生成的空間理解能力

研究團隊推出CoMPaSS-FLUX.1模型，基於FLUX.1文本到圖像擴散模型，通過LoRA適配器顯著提升生成圖像時對物體空間關係的理解能力。該模型在特定空間關係處理方面取得突破，文件大小約50MB，使用Diffusers框架，爲圖像生成領域帶來新可能。

新模型 CoMPaSS-FLUX.1：提升Flux文本到圖像生成的空間理解能力

阿里發佈 FLUX.1-Turbo-Alpha：基於FLUX.1-dev、8步提煉Lora

近日，阿里媽媽創意團隊發佈了 FLUX.1-Turbo-Alpha，這是基於 FLUX.1-dev 模型訓練的一款8步蒸餾 Lora 模型。該模型採用了多頭判別器，顯著提高了蒸餾的質量，支持文本到圖像生成、修復控制網等多種 FLUX 相關的應用。團隊建議在使用時將引導尺度設置爲3.5，Lora 尺度爲1，未來還會推出更低步數的版本。FLUX.1-Turbo-Alpha 可以直接與 Diffusers 框架結合使用。用戶只需通過幾行代碼便能加載模型並生成所需的圖像。例如，你可以創建一個有趣的場景:一隻微笑的樹懶穿着皮夾克、牛仔帽、格子裙和蝴蝶

阿里發佈 FLUX.1-Turbo-Alpha：基於FLUX.1-dev、8步提煉Lora

半真半幻！基於Flux.1 的LoRA模型Half_illustration 讓照片秒變藝術大片

基於Flux.1的LoRA模型Half_illustration是一款創新的圖像處理工具，它能夠將普通照片轉化爲融合了攝影與插畫元素的藝術作品。用戶只需描述一個場景或添加特定指令（如“in the style of TOK”），模型就能生成既真實又夢幻、充滿視覺衝擊力的大片。這款工具支持廣泛的創意場景，包括特定風格的時尚攝影、藝術創作、廣告設計等，適用於各種視覺作品的創作。其API接口和與Diffusers庫的兼容性，使得開發者和創意人員能夠更便捷地使用這款模型，進行快速圖像生成和個性化定製。

半真半幻！基於Flux.1 的LoRA模型Half_illustration 讓照片秒變藝術大片

騰訊混元DiT推出6G小顯存版本混元Captioner正式對外開源

騰訊最新升級的混元文生圖大模型（混元DiT）1.2版本，適配了Onijza、LoRA、ControlNet和Kohya插件於Diffusers庫，顯著降低了訓練個性化圖像生成模型的門檻。該升級版本圖片質感和構圖顯著提升，支持中英文雙語描述的混元Captioner模型更準確地理解中文語義，生成結構化、完整和準確的圖片描述。混元Captioner模型的開源，允許全球研究者和數據標註人員提升圖像描述質量，生成更全面準確的圖片描述，大大提高其在訓練各類視覺模型過程中的應用效果。最重要的是，混元DiT模型的小顯存版本簡化了使用成本，最低僅需6G顯存即可運行，從而擴大了其在個人電腦領域的廣泛應用潛力。QinT技術報告詳述了此模型的創新功能和應用優化。

20.4k 14 小時前

騰訊混元DiT推出6G小顯存版本混元Captioner正式對外開源

AI產品

Diffusers Image Outpaint

Diffusers Image Outpaint

使用擴散模型進行圖像外延

ComfyUI-KwaiKolorsWrapper

ComfyUI-KwaiKolorsWrapper

用於 Kwai-Kolors 文本到圖像模型的擴散器包裝器

模型

FLUX.2 Dev Bnb 4bit

diffusers

FLUX.2-dev是基於NF4量化的DiT和文本編碼器的圖像生成與編輯模型，提供高質量的圖像生成和編輯能力，適用於圖像領域的開發應用。

計算機視覺

Diffusers

Diffusers英語

Anime2Realism

uriel353

Anime2Realism是一個基於Qwen/Qwen-Image基礎模型的文本到圖像轉換模型，專門實現從動漫風格到寫實風格的圖像轉換。該模型利用LoRA和Diffusers技術，能夠根據文本描述生成相應的寫實風格圖像。

計算機視覺

Diffusers

Latinanime V20 Sdxl

John6666

Noobai-XL-1.0是一個基於diffusers庫的文本到圖像生成模型，專門用於生成動漫風格的女孩圖像。該模型由HetaKoneko創建，以Laxhar/noobai-XL-1.0為基礎，能夠生成具有獨特風格的動漫圖像。

計算機視覺

Diffusers

Diffusers英語

Oct_2025

EarthnDusk

Earth & Dusk項目是一個基於OnomaAIResearch/Illustrious-xl-early-release-v0基礎模型的文本到圖像轉換項目，使用diffusers庫實現圖像生成。該項目專注於藝術創作，採用CREATIVE ML OPEN RAIL M許可證，由0FTH3N1GHT PRODUCTIONS監督。

計算機視覺

Diffusers

Diffusers多語言

Aluan V8 Sdxl

John6666

這是一個專注於生成動漫、卡通風格圖像的文本到圖像生成模型，能夠生成包含幻想、美女等多種元素的動漫風格圖像。模型基於OnomaAIResearch/Illustrious-xl-early-release-v0基礎模型構建，採用diffusers庫實現。

計算機視覺

Diffusers

Diffusers英語

Hannah

julien8082

這是一個基於文本生成圖像的項目，使用了LoRA和Diffusers技術，基於tencent/SRPO模型，可通過特定觸發詞'hannah'生成相關圖像。

計算機視覺

Diffusers

HunyuanImage 2.1 Refiner Diffusers

hunyuanvideo-community

HunyuanImage-2.1 圖像精煉器是基於diffusers庫構建的圖像到圖像轉換模型，能夠將輸入圖像轉換為特定風格的圖像，支持高質量圖像生成和風格轉換。

計算機視覺

Diffusers

Diffusers多語言

hunyuanvideo-community

HunyuanImage 2.1 Diffusers

hunyuanvideo-community

混元圖像2.1是基於diffusers庫的文生圖模型，能夠根據文本描述生成高質量的圖像，支持中英雙語輸入，為用戶提供便捷的圖像生成體驗。

計算機視覺

Diffusers

Diffusers多語言

hunyuanvideo-community

RUSK

sagata007

RUSKANIME2025是基於LoRA和Diffusers技術的文本到圖像生成模型，專門用於通過特定觸發詞生成相關動漫風格圖像。該模型基於black-forest-labs/FLUX.1-dev基礎模型構建，採用擴散LoRA模板技術。

計算機視覺

Diffusers

Put It Here_KonText_V4

opocai

這是一個基於LoRA和Diffusers技術的文本到圖像生成模型，使用特定觸發詞'Put it here'來生成高質量圖像。該模型基於FLUX.1-Kontext-dev基礎模型構建，支持自適應光線調整和4K高清畫質輸出。

計算機視覺

Diffusers

Qwen Image Lightning

chaitnya26

Qwen-Image-Lightning是基於Qwen/Qwen-Image的文本到圖像生成模型，通過蒸餾和LoRA技術實現快速高質量的圖像生成，支持使用diffusers庫便捷調用。

Diffusers

Diffusers多語言

Peyton

Keltezaa

Peyton是一個基於FLUX.1-dev架構的文本到圖像生成模型，支持LoRA和Diffusers技術，能夠通過特定觸發詞生成相關圖像內容。

計算機視覺

Diffusers

FastWan2.2 TI2V 5B FullAttn Diffusers

FastVideo

FastVideo FastWan2.2-TI2V-5B-FullAttn-Diffusers 是一個基於diffusers庫構建的文本到視頻生成模型，採用新穎的稀疏蒸餾策略進行微調，支持3步快速推理，能夠生成高質量121×704×1280分辨率的視頻。

Diffusers

Cyberrealistic Pony V127 Alternative Sdxl

John6666

這是一個基於diffusers庫的文本到圖像生成模型，專門用於生成具有寫實風格的小馬圖像。該模型在色彩表現、光影效果和對比度方面表現優異，能夠生成高質量、逼真的小馬圖像。

計算機視覺

Diffusers

Diffusers英語

Krea Gguf

calcuis

Krea的GGUF量化版本是基於FLUX.1架構的文本到圖像生成模型，通過GGUF量化技術優化了模型大小和推理效率，支持通過diffusers庫、ComfyUI和gguf-connector等多種方式運行。

Diffusers

Diffusers英語

Put_it_here_KonText_V0.2_

opocai

Put_it_here_KonText_V0.2 是一個基於FLUX.1-Kontext-dev開發的文本到圖像轉換模型，採用LoRA和Diffusers技術，專注於高質量的圖像生成任務。

計算機視覺

Diffusers

AiGirl_II

Keltezaa

AiGirl_II 是一個基於 black-forest-labs/FLUX.1-dev 構建的文本到圖像生成模型，結合了 LoRA 技術和 Diffusers 庫，專門用於生成特定風格的圖像。該模型採用 CC BY-NC-ND 4.0 許可證，適合非商業用途。

計算機視覺

Diffusers

Starlet

Keltezaa

這是一個基於LoRA和Diffusers技術的文本到圖像生成模型，專門用於生成美國明星風格的圖像。模型以black-forest-labs/FLUX.1-dev為基礎，通過特定觸發詞'American Starlet'來生成符合美國明星風格的視覺內容。

計算機視覺

Diffusers

Put It Here KonText_V01 Nunchaku

opocai

這是一個基於FLUX.1-Kontext-dev的文本到圖像生成模型，支持LoRA和Diffusers框架，能夠根據文本描述生成相應的視覺內容。

計算機視覺

Diffusers

Embeddings

tera0711

embeddings 項目是一個基於 LoRA 和 Diffusers 技術的文本到圖像轉換模型，使用 stabilityai/stable-diffusion-3.5-large 作為基礎模型，提供了擴散 LoRA 模板，能夠基於特定模型生成高質量的圖像。

Diffusers

AIBase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

© 2026AIBase

商務合作網站地圖