最好的解耦生成 AI工具模型_精选解耦生成资讯

AI资讯

字节跳动发布Seed3D2.0:几何与纹理双SOTA，API同步上线火山引擎

字节跳动Seed团队发布新一代3D生成大模型Seed3D2.0，在几何精度与材质真实度上实现突破，核心指标达行业领先水平，有效解决边缘软化、拓扑失真等痛点。模型采用“粗到精”两阶段DiT架构，通过解耦整体结构与细节，推动AI 3D内容生成迈向“生产级可用”。

12.8k 2 小时前

通义千问推出 Qwen-Image-Layered 模型，实现图片 “分层编辑” 突破

通义千问发布图像生成模型Qwen-Image-Layered，创新采用“图层拆解”技术，实现静态图片的精准编辑。该模型通过“图像解耦”思路，将图片自动分层，有效解决传统AI编辑中全局修改破坏一致性和局部编辑处理遮挡模糊边界的两大痛点，开启“指哪改哪”的新时代。

22.2k 1 天前

通义千问推出 Qwen-Image-Layered 模型，实现图片 “分层编辑” 突破

vLLM-Omni开源:把扩散模型、ViT、LLM塞进一条流水线，多模态推理一次跑完

vLLM团队推出首个“全模态”推理框架vLLM-Omni，将文本、图像、音频、视频的统一生成从概念验证变为可落地的代码。该框架采用解耦流水线架构，包括模态编码器（如ViT、Whisper）、LLM核心（沿用vLLM自回归引擎）和模态生成器（如DiT、Stable Diffusion），支持多模态输入与输出。开发者可通过GitHub和ReadTheDocs获取，并立即pip安装使用。

18.7k 昨天

昆仑元 AI 推出全新全模态融合模型 BaiZe-Omni-14b-a2b，推动 AI 技术新进展

昆仑元AI在2025世界计算大会上发布全模态融合模型BaiZe-Omni-14b-a2b，基于昇腾平台，具备文本、音频、图像和视频的理解与生成能力。采用模态解耦编码、统一跨模态融合和双分支功能设计等创新架构，推动多模态应用发展。模型流程包括输入处理、模态适配、融合、核心功能和输出解码。

14.2k 前天

模型

GPT-4.1 mini

Openai

$2.8

输入tokens/百万

$11.2

输出tokens/百万

上下文长度

Gemini 2.0 Flash-Lite

Google

$0.49

输入tokens/百万

$2.1

输出tokens/百万

上下文长度

Grok 4 Fast

Xai

$1.4

输入tokens/百万

$3.5

输出tokens/百万

上下文长度

o3-mini

Openai

$7.7

输入tokens/百万

$30.8

输出tokens/百万

200

上下文长度

GPT-5 Codex

Openai

输入tokens/百万

输出tokens/百万

上下文长度

Claude 3 Opus

Anthropic

$105

输入tokens/百万

$525

输出tokens/百万

200

上下文长度

Gemini 2.0 Flash

Google

$0.7

输入tokens/百万

$2.8

输出tokens/百万

上下文长度

Claude Haiku 4.5

Anthropic

输入tokens/百万

$35

输出tokens/百万

200

上下文长度

Gemini 2.5 Flash

Google

$2.1

输入tokens/百万

$17.5

输出tokens/百万

上下文长度

Claude Sonnet 4.5

Anthropic

$21

输入tokens/百万

$105

输出tokens/百万

200

上下文长度

Claude 3 Sonnet

Anthropic

$21

输入tokens/百万

$105

输出tokens/百万

200

上下文长度

Gemini 2.5 Flash-Lite

Google

$0.7

输入tokens/百万

$2.8

输出tokens/百万

上下文长度

qwen-image-plus

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

qwen3-coder-plus

Alibaba

输入tokens/百万

$16

输出tokens/百万

上下文长度

wan2.5-i2i-preview

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

qwen3-max

Alibaba

输入tokens/百万

$24

输出tokens/百万

256

上下文长度

Qianfan-Lightning

Baidu

输入tokens/百万

输出tokens/百万

128

上下文长度

qwen-image-edit

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

Doubao-Seed-Translation

Bytedance

$1.2

输入tokens/百万

$3.6

输出tokens/百万

上下文长度

Qwen3-Next-80B-A3B-Instruct

Alibaba

输入tokens/百万

输出tokens/百万

256

上下文长度

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

商务合作网站地图

AI资讯

字节跳动发布Seed3D2.0:几何与纹理双SOTA，API同步上线火山引擎

通义千问推出 Qwen-Image-Layered 模型，实现图片 “分层编辑” 突破

vLLM-Omni开源:把扩散模型、ViT、LLM塞进一条流水线，多模态推理一次跑完

昆仑元 AI 推出全新全模态融合模型 BaiZe-Omni-14b-a2b，推动 AI 技术新进展

模型

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen-image-plus

qwen3-coder-plus

wan2.5-i2i-preview

qwen3-max

Qianfan-Lightning

qwen-image-edit

Doubao-Seed-Translation

Qwen3-Next-80B-A3B-Instruct

VisionReasoner 7B

Janus Pro 7B

Janus Pro 1B

Janus Pro 7B

Janus Pro 1B

Janus Pro 7B

Janus 1.3B

TDD

AI资讯

字节跳动发布Seed3D2.0:几何与纹理双SOTA，API同步上线火山引擎

通义千问推出 Qwen-Image-Layered 模型，实现图片 “分层编辑” 突破

vLLM-Omni开源:把扩散模型、ViT、LLM塞进一条流水线，多模态推理一次跑完

​昆仑元 AI 推出全新全模态融合模型 BaiZe-Omni-14b-a2b，推动 AI 技术新进展

模型

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen-image-plus

qwen3-coder-plus

wan2.5-i2i-preview

qwen3-max

Qianfan-Lightning

qwen-image-edit

Doubao-Seed-Translation

Qwen3-Next-80B-A3B-Instruct

VisionReasoner 7B

Janus Pro 7B

Janus Pro 1B

Janus Pro 7B

Janus Pro 1B

Janus Pro 7B

Janus 1.3B

TDD

昆仑元 AI 推出全新全模态融合模型 BaiZe-Omni-14b-a2b，推动 AI 技术新进展