最好的DiT AI工具模型_精選DiT資訊 - AIBase

AI資訊

騰訊炸場！10億參數文生3D動作神器開源，遊戲NPC一鍵“活”了！

騰訊混元團隊開源HY-Motion1.0模型，基於DiT架構與流匹配技術，通過文本描述即可生成高質量3D骨骼動畫，兼容主流3D工具，大幅降低動畫製作門檻。該模型採用全階段訓練策略，利用超3000小時動作數據優化生成效果。

騰訊炸場！10億參數文生3D動作神器開源，遊戲NPC一鍵“活”了！

MiniMax聯合華中科大開源VTP技術！僅優化視覺分詞器，DiT生成性能飆升65.8%

MiniMax與華中科技大學聯合開源VTP技術，僅優化視覺分詞器，使圖像生成性能提升65.8%，無需修改主模型架構，突破行業依賴大模型的傳統思路。

9.6k 17 分鐘前

MiniMax聯合華中科大開源VTP技術！僅優化視覺分詞器，DiT生成性能飆升65.8%

vLLM-Omni開源:把擴散模型、ViT、LLM塞進一條流水線，多模態推理一次跑完

vLLM團隊推出首個“全模態”推理框架vLLM-Omni，將文本、圖像、音頻、視頻的統一生成從概念驗證變爲可落地的代碼。該框架採用解耦流水線架構，包括模態編碼器（如ViT、Whisper）、LLM核心（沿用vLLM自迴歸引擎）和模態生成器（如DiT、Stable Diffusion），支持多模態輸入與輸出。開發者可通過GitHub和ReadTheDocs獲取，並立即pip安裝使用。

14.2k 5 小時前

vLLM-Omni開源:把擴散模型、ViT、LLM塞進一條流水線，多模態推理一次跑完

阿里巴巴開源 Z-Image 圖像模型：支持中英雙語文字渲染

阿里巴巴開源Z-Image圖像生成模型，僅6B參數實現高效生成與編輯，視覺質量接近20B級別商業模型。該模型採用單流DiT架構，生成速度快、資源佔用低，有望推動AI圖像工具普及消費級應用。

35k 2 小時前

AI產品

Seedance 1.5 Pro by ByteDance

Seedance 1.5 Pro by ByteDance

ByteDance的Seedance 1.5 Pro，用DB - DiT生成帶音畫同步的電影級視頻

DreamActor-M1

DreamActor-M1

基於 DiT 的人類圖像動畫框架，實現精細控制與長效一致性。

DiTCtrl

DiTCtrl

探索多模態擴散變換器中的注意力控制，實現無需調優的多提示長視頻生成

LTX-Video

LTX-Video

基於DiT的視頻生成模型，即時生成高質量視頻。

模型

qwen-image-edit

Alibaba

qwen-image-edit

-

輸入tokens/百萬

-

輸出tokens/百萬

-

上下文長度

DeepSeek-V3.1

Deepseek

DeepSeek-V3.1

$4

輸入tokens/百萬

$12

輸出tokens/百萬

128

上下文長度

GLM-4.5-AirX

Chatglm

GLM-4.5-AirX

-

輸入tokens/百萬

-

輸出tokens/百萬

128

上下文長度

GLM-4.5-Air

Chatglm

GLM-4.5-Air

-

輸入tokens/百萬

-

輸出tokens/百萬

128

上下文長度

GLM-4.5-Flash

Chatglm

GLM-4.5-Flash

-

輸入tokens/百萬

-

輸出tokens/百萬

128

上下文長度

DeepSeek-R1

Deepseek

DeepSeek-R1

$4

輸入tokens/百萬

$16

輸出tokens/百萬

32

上下文長度

Wan2.1-I2V-14B-480P

Alibaba

Wan2.1-I2V-14B-480P

-

輸入tokens/百萬

-

輸出tokens/百萬

-

上下文長度

DeepSeek-V3

Deepseek

DeepSeek-V3

$2

輸入tokens/百萬

$8

輸出tokens/百萬

32

上下文長度

GLM-Z1-Flash

Chatglm

GLM-Z1-Flash

-

輸入tokens/百萬

-

輸出tokens/百萬

128

上下文長度

MiniMax Hailuo-02 768P

Minimax

MiniMax Hailuo-02 768P

-

輸入tokens/百萬

-

輸出tokens/百萬

-

上下文長度

Step-1X

Stepfun

Step-1X

-

輸入tokens/百萬

-

輸出tokens/百萬

-

上下文長度

ERNIE-4.5-300B-A47B-Paddle

Baidu

ERNIE-4.5-300B-A47B-Paddle

-

輸入tokens/百萬

-

輸出tokens/百萬

-

上下文長度

PaddleMIX-PP-DocBee

Baidu

PaddleMIX-PP-DocBee

-

輸入tokens/百萬

-

輸出tokens/百萬

-

上下文長度

CogView-3-Plus

Chatglm

CogView-3-Plus

-

輸入tokens/百萬

-

輸出tokens/百萬

-

上下文長度

AIBase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

© 2026AIBase

商務合作網站地圖