Best 开源扩散模型 AI Tools & Models - Premium 开源扩散模型 News

AI News

打破算力垄断：智谱联合华为发布首个全流程国产化多模态大模型 GLM-Image

智谱联合华为开源图像生成模型GLM-Image，这是首个在国产芯片上完成全流程训练的SOTA多模态模型。其创新采用“自回归+扩散解码器”混合架构，实现了图像生成与语言模型的深度融合，在知识密集型任务中表现出色，能精准理解全局指令。

9.3k 53 minutes ago

输入分镜脚本，几秒生成1分钟连贯叙事视频！字节开源StoryMem，让AI视频角色永不“变脸”

字节跳动与南洋理工大学联合推出开源框架StoryMem，通过创新的“视觉记忆”机制，将单镜头视频扩散模型升级为多镜头长视频生成工具，能自动生成超过1分钟、镜头切换自然、角色场景连贯的叙事视频，推动开源AI视频技术向电影级叙事迈进。

25.5k 5 hours ago

输入分镜脚本，几秒生成1分钟连贯叙事视频！字节开源StoryMem，让AI视频角色永不“变脸”

清华开源TurboDiffusion，AI视频生成速度暴增200倍，消费级显卡也能秒出大片！

清华大学TSAIL实验室与生数科技联合开源视频生成加速框架TurboDiffusion，将AI视频扩散模型的推理速度提升100至200倍，视觉质量几乎无损。该技术针对现有开源模型进行深度优化，在单张RTX 5090显卡上实现从分钟级到秒级的实时生成，标志着AI视频创作进入新时代。

12.5k 12 hours ago

清华开源TurboDiffusion，AI视频生成速度暴增200倍，消费级显卡也能秒出大片！

蚂蚁开源 LLaDA2.0，业内首个100B 参数规模的扩散语言模型

蚂蚁技术研究院发布LLaDA2.0系列，包含16B和100B版本，其中100B版为业内首个百亿参数离散扩散大语言模型。该模型突破扩散模型规模化瓶颈，显著提升生成质量与推理速度，为领域发展提供新方向。

22.5k 5 hours ago

AI Products

FastVideo

开源框架，加速大型视频扩散模型

视频生成

12.4k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

o3-mini

Openai

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen-image-plus

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

wan2.5-i2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

​打破算力垄断：智谱联合华为发布首个全流程国产化多模态大模型 GLM-Image

输入分镜脚本，几秒生成1分钟连贯叙事视频！字节开源StoryMem，让AI视频角色永不“变脸”

清华开源TurboDiffusion，AI视频生成速度暴增200倍，消费级显卡也能秒出大片！

蚂蚁开源 LLaDA2.0，业内首个100B 参数规模的扩散语言模型

AI Products

FastVideo

Models

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen-image-plus

qwen3-coder-plus

qwen3-vl-plus

qwen3-vl-235b-a22b-thinking

Qianfan-Lightning

qwen3-max

wan2.5-i2i-preview

qwen-image-edit

LLaDA MoE 7B A1B Base

SDAR 4B Chat

Dream Coder V0 Base 7B

SkyReels V2 I2V 14B 720P

Flex.2 Preview

SkyReels V2 T2V 14B 540P

SkyReels V2 DF 1.3B 540P

SkyReels V2 I2V 14B 540P

DiffusionLM

Platmoji

CogVideoX1.5 5B I2V

Kandinsky 3

Pai Diffusion General Large Zh

Pai Diffusion Food Large Zh

打破算力垄断：智谱联合华为发布首个全流程国产化多模态大模型 GLM-Image