最好的解耦生成 AI工具模型_精選解耦生成資訊

AI資訊

字節跳動發佈Seed3D2.0:幾何與紋理雙SOTA，API同步上線火山引擎

字節跳動Seed團隊發佈新一代3D生成大模型Seed3D2.0，在幾何精度與材質真實度上實現突破，核心指標達行業領先水平，有效解決邊緣軟化、拓撲失真等痛點。模型採用“粗到精”兩階段DiT架構，通過解耦整體結構與細節，推動AI 3D內容生成邁向“生產級可用”。

15.4k 5 小時前

通義千問推出 Qwen-Image-Layered 模型，實現圖片 “分層編輯” 突破

通義千問發佈圖像生成模型Qwen-Image-Layered，創新採用“圖層拆解”技術，實現靜態圖片的精準編輯。該模型通過“圖像解耦”思路，將圖片自動分層，有效解決傳統AI編輯中全局修改破壞一致性和局部編輯處理遮擋模糊邊界的兩大痛點，開啓“指哪改哪”的新時代。

22.1k 7 小時前

通義千問推出 Qwen-Image-Layered 模型，實現圖片 “分層編輯” 突破

vLLM-Omni開源:把擴散模型、ViT、LLM塞進一條流水線，多模態推理一次跑完

vLLM團隊推出首個“全模態”推理框架vLLM-Omni，將文本、圖像、音頻、視頻的統一生成從概念驗證變爲可落地的代碼。該框架採用解耦流水線架構，包括模態編碼器（如ViT、Whisper）、LLM核心（沿用vLLM自迴歸引擎）和模態生成器（如DiT、Stable Diffusion），支持多模態輸入與輸出。開發者可通過GitHub和ReadTheDocs獲取，並立即pip安裝使用。

18.9k 昨天

崑崙元 AI 推出全新全模態融合模型 BaiZe-Omni-14b-a2b，推動 AI 技術新進展

崑崙元AI在2025世界計算大會上發佈全模態融合模型BaiZe-Omni-14b-a2b，基於昇騰平臺，具備文本、音頻、圖像和視頻的理解與生成能力。採用模態解耦編碼、統一跨模態融合和雙分支功能設計等創新架構，推動多模態應用發展。模型流程包括輸入處理、模態適配、融合、核心功能和輸出解碼。

13.5k 7 小時前

模型

Gemini 2.0 Flash-Lite

Google

$0.49

輸入tokens/百萬

$2.1

輸出tokens/百萬

上下文長度

GPT-4.1 mini

Openai

$2.8

輸入tokens/百萬

$11.2

輸出tokens/百萬

上下文長度

Grok 4 Fast

Xai

$1.4

輸入tokens/百萬

$3.5

輸出tokens/百萬

上下文長度

o3-mini

Openai

$7.7

輸入tokens/百萬

$30.8

輸出tokens/百萬

200

上下文長度

GPT-5 Codex

Openai

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Claude 3 Opus

Anthropic

$105

輸入tokens/百萬

$525

輸出tokens/百萬

200

上下文長度

Gemini 2.0 Flash

Google

$0.7

輸入tokens/百萬

$2.8

輸出tokens/百萬

上下文長度

Claude Haiku 4.5

Anthropic

輸入tokens/百萬

$35

輸出tokens/百萬

200

上下文長度

Gemini 2.5 Flash

Google

$2.1

輸入tokens/百萬

$17.5

輸出tokens/百萬

上下文長度

Claude Sonnet 4.5

Anthropic

$21

輸入tokens/百萬

$105

輸出tokens/百萬

200

上下文長度

Claude 3 Sonnet

Anthropic

$21

輸入tokens/百萬

$105

輸出tokens/百萬

200

上下文長度

Gemini 2.5 Flash-Lite

Google

$0.7

輸入tokens/百萬

$2.8

輸出tokens/百萬

上下文長度

wan2.5-i2i-preview

Alibaba

輸入tokens/百萬

輸出tokens/百萬

上下文長度

qwen3-max

Alibaba

輸入tokens/百萬

$24

輸出tokens/百萬

256

上下文長度

qwen-image-plus

Alibaba

輸入tokens/百萬

輸出tokens/百萬

上下文長度

qwen3-coder-plus

Alibaba

輸入tokens/百萬

$16

輸出tokens/百萬

上下文長度

Qianfan-Lightning

Baidu

輸入tokens/百萬

輸出tokens/百萬

128

上下文長度

Doubao-Seed-Translation

Bytedance

$1.2

輸入tokens/百萬

$3.6

輸出tokens/百萬

上下文長度

qwen-image-edit

Alibaba

輸入tokens/百萬

輸出tokens/百萬

上下文長度

wan2.5-t2v-preview

Alibaba

輸入tokens/百萬

輸出tokens/百萬

上下文長度

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

商務合作網站地圖

AI資訊

字節跳動發佈Seed3D2.0:幾何與紋理雙SOTA，API同步上線火山引擎

通義千問推出 Qwen-Image-Layered 模型，實現圖片 “分層編輯” 突破

vLLM-Omni開源:把擴散模型、ViT、LLM塞進一條流水線，多模態推理一次跑完

崑崙元 AI 推出全新全模態融合模型 BaiZe-Omni-14b-a2b，推動 AI 技術新進展

模型

Gemini 2.0 Flash-Lite

GPT-4.1 mini

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

wan2.5-i2i-preview

qwen3-max

qwen-image-plus

qwen3-coder-plus

Qianfan-Lightning

Doubao-Seed-Translation

qwen-image-edit

wan2.5-t2v-preview

VisionReasoner 7B

Janus Pro 7B

Janus Pro 1B

Janus Pro 7B

Janus Pro 1B

Janus Pro 7B

Janus 1.3B

TDD

AI資訊

字節跳動發佈Seed3D2.0:幾何與紋理雙SOTA，API同步上線火山引擎

通義千問推出 Qwen-Image-Layered 模型，實現圖片 “分層編輯” 突破

vLLM-Omni開源:把擴散模型、ViT、LLM塞進一條流水線，多模態推理一次跑完

​崑崙元 AI 推出全新全模態融合模型 BaiZe-Omni-14b-a2b，推動 AI 技術新進展

模型

Gemini 2.0 Flash-Lite

GPT-4.1 mini

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

wan2.5-i2i-preview

qwen3-max

qwen-image-plus

qwen3-coder-plus

Qianfan-Lightning

Doubao-Seed-Translation

qwen-image-edit

wan2.5-t2v-preview

VisionReasoner 7B

Janus Pro 7B

Janus Pro 1B

Janus Pro 7B

Janus Pro 1B

Janus Pro 7B

Janus 1.3B

TDD

崑崙元 AI 推出全新全模態融合模型 BaiZe-Omni-14b-a2b，推動 AI 技術新進展