最好的DiT AI工具模型_精选DiT资讯

AI资讯

字节跳动开源Lance 3B：用一个“脑子”同时搞定图视理解与生成

字节跳动开源Lance，一款仅3B激活参数的原生统一多模态大模型，打破“理解模型（VLM）”与“生成模型（DiT/Diffusion）”的技术壁垒。它以极致轻量化实现全功能覆盖，挑战当前AI行业堆砌参数或“拼积木”组装模型的风气，成为技术创新的重要突破。

24.7k 昨天

不必联网！OPPO 发布全球首个手机端 AI 调色引擎，让你的照片焕然一新！

OPPO在联发科天玑开发者大会上推出全球首个端侧AIGC光影处理引擎，基于自研DiT架构，专为解决户外复杂光线问题（如逆光、强光、阴影交错）而设计，可有效改善人物面部偏暗、背景过曝及细节丢失等拍摄痛点，为摄影爱好者带来福音。

17.7k 12 小时前

字节跳动发布Seed3D2.0:几何与纹理双SOTA，API同步上线火山引擎

字节跳动Seed团队发布新一代3D生成大模型Seed3D2.0，在几何精度与材质真实度上实现突破，核心指标达行业领先水平，有效解决边缘软化、拓扑失真等痛点。模型采用“粗到精”两阶段DiT架构，通过解耦整体结构与细节，推动AI 3D内容生成迈向“生产级可用”。

17.1k 20 小时前

DiT 作者谢赛宁再出王炸！多人视频世界模型 Solaris 发布，种子轮估值已超 35 亿美元

2026年3月11日，谢赛宁团队发布全球首个多人视频世界模型Solaris，实现从“单人单视角”到“多人交互世界”的跨越。其核心技术基于昆仑天工开源架构，引入多人自注意力层，显著提升了建筑一致性，验证了多玩家在虚拟世界中的协同感知能力。

17.5k 9 小时前

AI产品

Seedance 1.5 Pro by ByteDance

ByteDance的Seedance 1.5 Pro，用DB - DiT生成带音画同步的电影级视频

视频生成

9.5k

DreamActor-M1

基于 DiT 的人类图像动画框架，实现精细控制与长效一致性。

视频生成

12.9k

DiTCtrl

探索多模态扩散变换器中的注意力控制，实现无需调优的多提示长视频生成

视频生成

10.7k

LTX-Video

基于DiT的视频生成模型，实时生成高质量视频。

视频生成

12.5k

模型

qwen-image-edit

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

DeepSeek-V3.1

Deepseek

输入tokens/百万

$12

输出tokens/百万

128

上下文长度

GLM-4.5-Flash

Chatglm

输入tokens/百万

输出tokens/百万

128

上下文长度

GLM-4.5-AirX

Chatglm

输入tokens/百万

输出tokens/百万

128

上下文长度

GLM-4.5-Air

Chatglm

输入tokens/百万

输出tokens/百万

128

上下文长度

DeepSeek-R1

Deepseek

输入tokens/百万

$16

输出tokens/百万

上下文长度

DeepSeek-V3

Deepseek

输入tokens/百万

输出tokens/百万

上下文长度

Wan2.1-I2V-14B-480P

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

GLM-Z1-Flash

Chatglm

输入tokens/百万

输出tokens/百万

128

上下文长度

MiniMax Hailuo-02 768P

Minimax

输入tokens/百万

输出tokens/百万

上下文长度

Step-1X

Stepfun

输入tokens/百万

输出tokens/百万

上下文长度

ERNIE-4.5-300B-A47B-Paddle

Baidu

输入tokens/百万

输出tokens/百万

上下文长度

PaddleMIX-PP-DocBee

Baidu

输入tokens/百万

输出tokens/百万

上下文长度

CogView-3-Plus

Chatglm

输入tokens/百万

输出tokens/百万

上下文长度

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AI Marketing LLM Leaderboard AI Ranking

商务合作网站地图

AI资讯

字节跳动开源Lance 3B：用一个“脑子”同时搞定图视理解与生成

不必联网！OPPO 发布全球首个手机端 AI 调色引擎，让你的照片焕然一新！

字节跳动发布Seed3D2.0:几何与纹理双SOTA，API同步上线火山引擎

DiT 作者谢赛宁再出王炸！多人视频世界模型 Solaris 发布，种子轮估值已超 35 亿美元

AI产品

Seedance 1.5 Pro by ByteDance

DreamActor-M1

DiTCtrl

LTX-Video

模型

qwen-image-edit

DeepSeek-V3.1

GLM-4.5-Flash

GLM-4.5-AirX

GLM-4.5-Air

DeepSeek-R1

DeepSeek-V3

Wan2.1-I2V-14B-480P

GLM-Z1-Flash

MiniMax Hailuo-02 768P

Step-1X

ERNIE-4.5-300B-A47B-Paddle

PaddleMIX-PP-DocBee

CogView-3-Plus

HistoricColor_Z Image Turbo LoRA

FLUX.2 Dev Bnb 4bit

Qwen Image Edit MeiTu

LTX Video 0.9.7 Distilled

LTX Video 0.9.7 Dev

Gemma 2 9b It Russian Function Calling GGUF

DiT Wikiart Large

DiT Wikiart Small

LTX Video 0.9.1

LTX Video 0.9.5

InfiniteYou

LTX Video

LTX Video

Ditr E15

CogView3 Plus 3B

3DTopia XL

Dit Base Layout Detection

Cross Encoder Russian Msmarco

Bi Encoder Russian Msmarco

Dit Doclaynet