最好的Diffusers AI工具模型_精选Diffusers资讯 - AIBase

AI资讯

新模型 CoMPaSS-FLUX.1：提升Flux文本到图像生成的空间理解能力

研究团队推出CoMPaSS-FLUX.1模型，基于FLUX.1文本到图像扩散模型，通过LoRA适配器显著提升生成图像时对物体空间关系的理解能力。该模型在特定空间关系处理方面取得突破，文件大小约50MB，使用Diffusers框架，为图像生成领域带来新可能。

新模型 CoMPaSS-FLUX.1：提升Flux文本到图像生成的空间理解能力

阿里发布 FLUX.1-Turbo-Alpha：基于FLUX.1-dev、8步提炼Lora

近日，阿里妈妈创意团队发布了 FLUX.1-Turbo-Alpha，这是基于 FLUX.1-dev 模型训练的一款8步蒸馏 Lora 模型。该模型采用了多头判别器，显著提高了蒸馏的质量，支持文本到图像生成、修复控制网等多种 FLUX 相关的应用。团队建议在使用时将引导尺度设置为3.5，Lora 尺度为1，未来还会推出更低步数的版本。FLUX.1-Turbo-Alpha 可以直接与 Diffusers 框架结合使用。用户只需通过几行代码便能加载模型并生成所需的图像。例如，你可以创建一个有趣的场景:一只微笑的树懒穿着皮夹克、牛仔帽、格子裙和蝴蝶

阿里发布 FLUX.1-Turbo-Alpha：基于FLUX.1-dev、8步提炼Lora

半真半幻！基于Flux.1 的LoRA模型Half_illustration 让照片秒变艺术大片

基于Flux.1的LoRA模型Half_illustration是一款创新的图像处理工具，它能够将普通照片转化为融合了摄影与插画元素的艺术作品。用户只需描述一个场景或添加特定指令（如“in the style of TOK”），模型就能生成既真实又梦幻、充满视觉冲击力的大片。这款工具支持广泛的创意场景，包括特定风格的时尚摄影、艺术创作、广告设计等，适用于各种视觉作品的创作。其API接口和与Diffusers库的兼容性，使得开发者和创意人员能够更便捷地使用这款模型，进行快速图像生成和个性化定制。

半真半幻！基于Flux.1 的LoRA模型Half_illustration 让照片秒变艺术大片

腾讯混元DiT推出6G小显存版本混元Captioner正式对外开源

腾讯最新升级的混元文生图大模型（混元DiT）1.2版本，适配了Onijza、LoRA、ControlNet和Kohya插件于Diffusers库，显著降低了训练个性化图像生成模型的门槛。该升级版本图片质感和构图显著提升，支持中英文双语描述的混元Captioner模型更准确地理解中文语义，生成结构化、完整和准确的图片描述。混元Captioner模型的开源，允许全球研究者和数据标注人员提升图像描述质量，生成更全面准确的图片描述，大大提高其在训练各类视觉模型过程中的应用效果。最重要的是，混元DiT模型的小显存版本简化了使用成本，最低仅需6G显存即可运行，从而扩大了其在个人电脑领域的广泛应用潜力。QinT技术报告详述了此模型的创新功能和应用优化。

腾讯混元DiT推出6G小显存版本混元Captioner正式对外开源

AI产品

Diffusers Image Outpaint

Diffusers Image Outpaint

使用扩散模型进行图像外延

ComfyUI-KwaiKolorsWrapper

ComfyUI-KwaiKolorsWrapper

用于 Kwai-Kolors 文本到图像模型的扩散器包装器

模型

FLUX.2 Dev Bnb 4bit

diffusers

FLUX.2-dev是基于NF4量化的DiT和文本编码器的图像生成与编辑模型，提供高质量的图像生成和编辑能力，适用于图像领域的开发应用。

计算机视觉

Diffusers

Diffusers英语

Anime2Realism

uriel353

Anime2Realism是一个基于Qwen/Qwen-Image基础模型的文本到图像转换模型，专门实现从动漫风格到写实风格的图像转换。该模型利用LoRA和Diffusers技术，能够根据文本描述生成相应的写实风格图像。

计算机视觉

Diffusers

Latinanime V20 Sdxl

John6666

Noobai-XL-1.0是一个基于diffusers库的文本到图像生成模型，专门用于生成动漫风格的女孩图像。该模型由HetaKoneko创建，以Laxhar/noobai-XL-1.0为基础，能够生成具有独特风格的动漫图像。

计算机视觉

Diffusers

Diffusers英语

Oct_2025

EarthnDusk

Earth & Dusk项目是一个基于OnomaAIResearch/Illustrious-xl-early-release-v0基础模型的文本到图像转换项目，使用diffusers库实现图像生成。该项目专注于艺术创作，采用CREATIVE ML OPEN RAIL M许可证，由0FTH3N1GHT PRODUCTIONS监督。

计算机视觉

Diffusers

Diffusers支持多种语言

Aluan V8 Sdxl

John6666

这是一个专注于生成动漫、卡通风格图像的文本到图像生成模型，能够生成包含幻想、美女等多种元素的动漫风格图像。模型基于OnomaAIResearch/Illustrious-xl-early-release-v0基础模型构建，采用diffusers库实现。

计算机视觉

Diffusers

Diffusers英语

Hannah

julien8082

这是一个基于文本生成图像的项目，使用了LoRA和Diffusers技术，基于tencent/SRPO模型，可通过特定触发词'hannah'生成相关图像。

计算机视觉

Diffusers

HunyuanImage 2.1 Refiner Diffusers

hunyuanvideo-community

HunyuanImage-2.1 图像精炼器是基于diffusers库构建的图像到图像转换模型，能够将输入图像转换为特定风格的图像，支持高质量图像生成和风格转换。

计算机视觉

Diffusers

Diffusers支持多种语言

hunyuanvideo-community

HunyuanImage 2.1 Diffusers

hunyuanvideo-community

混元图像2.1是基于diffusers库的文生图模型，能够根据文本描述生成高质量的图像，支持中英双语输入，为用户提供便捷的图像生成体验。

计算机视觉

Diffusers

Diffusers支持多种语言

hunyuanvideo-community

RUSK

sagata007

RUSKANIME2025是基于LoRA和Diffusers技术的文本到图像生成模型，专门用于通过特定触发词生成相关动漫风格图像。该模型基于black-forest-labs/FLUX.1-dev基础模型构建，采用扩散LoRA模板技术。

计算机视觉

Diffusers

Put It Here_KonText_V4

opocai

这是一个基于LoRA和Diffusers技术的文本到图像生成模型，使用特定触发词'Put it here'来生成高质量图像。该模型基于FLUX.1-Kontext-dev基础模型构建，支持自适应光线调整和4K高清画质输出。

计算机视觉

Diffusers

Qwen Image Lightning

chaitnya26

Qwen-Image-Lightning是基于Qwen/Qwen-Image的文本到图像生成模型，通过蒸馏和LoRA技术实现快速高质量的图像生成，支持使用diffusers库便捷调用。

Diffusers

Diffusers支持多种语言

Peyton

Keltezaa

Peyton是一个基于FLUX.1-dev架构的文本到图像生成模型，支持LoRA和Diffusers技术，能够通过特定触发词生成相关图像内容。

计算机视觉

Diffusers

FastWan2.2 TI2V 5B FullAttn Diffusers

FastVideo

FastVideo FastWan2.2-TI2V-5B-FullAttn-Diffusers 是一个基于diffusers库构建的文本到视频生成模型，采用新颖的稀疏蒸馏策略进行微调，支持3步快速推理，能够生成高质量121×704×1280分辨率的视频。

Diffusers

Cyberrealistic Pony V127 Alternative Sdxl

John6666

这是一个基于diffusers库的文本到图像生成模型，专门用于生成具有写实风格的小马图像。该模型在色彩表现、光影效果和对比度方面表现优异，能够生成高质量、逼真的小马图像。

计算机视觉

Diffusers

Diffusers英语

Krea Gguf

calcuis

Krea的GGUF量化版本是基于FLUX.1架构的文本到图像生成模型，通过GGUF量化技术优化了模型大小和推理效率，支持通过diffusers库、ComfyUI和gguf-connector等多种方式运行。

Diffusers

Diffusers英语

Put_it_here_KonText_V0.2_

opocai

Put_it_here_KonText_V0.2 是一个基于FLUX.1-Kontext-dev开发的文本到图像转换模型，采用LoRA和Diffusers技术，专注于高质量的图像生成任务。

计算机视觉

Diffusers

AiGirl_II

Keltezaa

AiGirl_II 是一个基于 black-forest-labs/FLUX.1-dev 构建的文本到图像生成模型，结合了 LoRA 技术和 Diffusers 库，专门用于生成特定风格的图像。该模型采用 CC BY-NC-ND 4.0 许可证，适合非商业用途。

计算机视觉

Diffusers

Starlet

Keltezaa

这是一个基于LoRA和Diffusers技术的文本到图像生成模型，专门用于生成美国明星风格的图像。模型以black-forest-labs/FLUX.1-dev为基础，通过特定触发词'American Starlet'来生成符合美国明星风格的视觉内容。

计算机视觉

Diffusers

Put It Here KonText_V01 Nunchaku

opocai

这是一个基于FLUX.1-Kontext-dev的文本到图像生成模型，支持LoRA和Diffusers框架，能够根据文本描述生成相应的视觉内容。

计算机视觉

Diffusers

Embeddings

tera0711

embeddings 项目是一个基于 LoRA 和 Diffusers 技术的文本到图像转换模型，使用 stabilityai/stable-diffusion-3.5-large 作为基础模型，提供了扩散 LoRA 模板，能够基于特定模型生成高质量的图像。

Diffusers

AIBase

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

© 2026AIBase

商务合作网站地图