Best 扩散变换器 AI Tools & Models - Premium 扩散变换器 News

AI News

Kling 2.6将发布：原生音频+10秒1080P，AI视频进入有声时代

快手Kling AI 2.6版本发布，首次集成音频生成功能，支持中英双语对白、歌唱与音效，实现文本、视频、音频一键同步生成。技术采用扩散变换器与3D时空联合注意力架构，提升复杂指令遵守率15%，并增强跨镜头角色一致性。视频输出保持10秒1080P高清，生成成本降低30%。

20.9k yesterday

苹果推出 STARFlow：全新 AI 图像生成技术想力压 DALL-E 与 Midjourney

苹果公司研发新型AI图像生成系统“STARFlow”，结合正则化流和自回归变换器技术，挑战当前主流扩散模型。该突破性成果已在研究论文中公布，并与多所学术机构合作完成。

8.7k 02-19

苹果推出 STARFlow：全新 AI 图像生成技术想力压 DALL-E 与 Midjourney

阿里开源 Qwen-Image-Edit：中文渲染秒杀 GPT-4o，精准文本编辑+语义外观双控

阿里通义千问团队开源图像编辑模型Qwen-Image-Edit，基于20B参数多模态扩散变换器，在精准文本编辑、语义与外观编辑方面表现卓越，尤其在中文文本渲染上实现行业领先，支持中英文双语精准渲染。

17.7k 5 days ago

阿里开源 Qwen-Image-Edit：中文渲染秒杀 GPT-4o，精准文本编辑+语义外观双控

虚拟试穿工具Voost，能还原服装的纹理、褶皱细节

研究人员推出Voost框架，通过单一扩散变换器实现虚拟试衣/试脱双向学习，无需额外标签。创新采用注意力温度缩放和自校正采样技术提升模型稳定性，在多项基准测试中表现优异，显著提升服装-身体对齐精度和生成质量。该技术为数字时尚领域带来突破，项目已开源。

11.4k 4 days ago

AI Products

FantasyPortrait

基于扩散变换器的多角色肖像动画生成框架。

AI角色生成

10.6k

InstantCharacter

InstantCharacter 是一种基于扩散变换器的角色个性化框架。

AI角色生成

12.2k

SkyReels-A2

在视频扩散变换器中合成任何内容的框架。

视频生成

13.2k

MakeAnything

MakeAnything 是一个用于多领域程序化序列生成的扩散变换器模型。

AI设计工具

9.2k

Models

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

Wan2.1-T2V-1.3B

Alibaba

Input tokens/M

Output tokens/M

Context Length

Gemini Diffusion

Google

Input tokens/M

Output tokens/M

Context Length

MiniMax Hailuo-02 1080P

Minimax

Input tokens/M

Output tokens/M

Context Length

CogView-3

Chatglm

Input tokens/M

Output tokens/M

Context Length

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

Kling 2.6将发布：原生音频+10秒1080P，AI视频进入有声时代

苹果推出 STARFlow：全新 AI 图像生成技术想力压 DALL-E 与 Midjourney

阿里开源 Qwen-Image-Edit：中文渲染秒杀 GPT-4o，精准文本编辑+语义外观双控

虚拟试穿工具Voost，能还原服装的纹理、褶皱细节

AI Products

FantasyPortrait

InstantCharacter

SkyReels-A2

MakeAnything

Models

qwen-image-edit

Wan2.1-T2V-1.3B

Gemini Diffusion

MiniMax Hailuo-02 1080P

CogView-3

UltraFlux V1

Normal Lora

ICEdit MoE LoRA

Textflux

DiT Wikiart Large

DiT Wikiart Small

InfiniteYou

Lumina Image 2.0

CLEAR

Stable Diffusion V3 5 Large GGUF

Stable Diffusion V3 5 Medium GGUF

Stable Diffusion 3.5 Medium

Stable Diffusion 3.5 Medium

Stable Diffusion 3.5 Large Turbo Ungated

Stable Diffusion 3.5 Large Ungated

Stable Diffusion 3.5 Large Turbo

3DTopia XL

Stable Diffusion 3 Medium Diffusers

Stable Diffusion 3 Medium

AI News

Kling 2.6将发布：原生音频+10秒1080P，AI视频进入有声时代

​苹果推出 STARFlow：全新 AI 图像生成技术想力压 DALL-E 与 Midjourney

阿里开源 Qwen-Image-Edit：中文渲染秒杀 GPT-4o，精准文本编辑+语义外观双控

虚拟试穿工具Voost，能还原服装的纹理、褶皱细节

AI Products

FantasyPortrait

InstantCharacter

SkyReels-A2

MakeAnything

Models

qwen-image-edit

Wan2.1-T2V-1.3B

Gemini Diffusion

MiniMax Hailuo-02 1080P

CogView-3

UltraFlux V1

Normal Lora

ICEdit MoE LoRA

Textflux

DiT Wikiart Large

DiT Wikiart Small

InfiniteYou

Lumina Image 2.0

CLEAR

Stable Diffusion V3 5 Large GGUF

Stable Diffusion V3 5 Medium GGUF

Stable Diffusion 3.5 Medium

Stable Diffusion 3.5 Medium

Stable Diffusion 3.5 Large Turbo Ungated

Stable Diffusion 3.5 Large Ungated

Stable Diffusion 3.5 Large Turbo

3DTopia XL

Stable Diffusion 3 Medium Diffusers

Stable Diffusion 3 Medium

苹果推出 STARFlow：全新 AI 图像生成技术想力压 DALL-E 与 Midjourney