字节发布创新图像合成技术XVerse：对多个个体进行独立且精确的控制

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · Jul 1, 2025

469

近日，字节正式发布其最新图像合成技术 ——XVerse，旨在提供高精度的多主体图像生成解决方案。这项创新的技术使得用户能够对多个个体进行独立且精确的控制，极大地提升了个性化和复杂场景生成的能力。

XVerse 的核心在于其独特的 DiT 调制方法，能够在不影响整体图像潜在特征的情况下，对每个主体的身份和语义属性进行调控。通过将参考图像转化为特定于令牌的文本流偏移量，XVerse 使得图像合成更加灵活和直观，用户只需简单的文字描述，即可生成符合预期的高保真图像。

在技术实现上，XVerse 要求用户首先创建一个包含 Python3.10.16的 conda 环境，并安装相应的依赖项。随后，用户需要下载相关的检查点和人脸识别模型，以保证技术的顺利运行。值得注意的是，XVerse 提供了一个互动的 Gradio 演示，用户可以通过上传图像和输入描述，实时生成图像，并调节多个参数来优化生成效果。

XVerse 的用户界面友好，提供了丰富的输入设置选项，包括图像描述、生成图像的高度和宽度等，用户可以灵活调整生成图像的特征。此外，用户可以使用 “检测与分割” 功能对上传的图像进行分析，自动裁剪人脸并生成相应的描述，从而提升生成的准确性和个性化。

总之，XVerse 作为一项革命性的技术，展现了图像合成的广阔前景，预计将对数字内容创作、广告以及艺术等多个领域产生深远影响。随着未来版本的发布，XVerse 有望成为业界标准，助力更多创意的实现。

地址:https://github.com/bytedance/XVerse

XVerse DiT调制方法图像合成技术字节

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

谷歌搜索引入“无结果生图”:AI 概览变身创意画布，恐分流网站流量

谷歌搜索的AI概览将新增图像生成功能，用户可直接输入文字生成图片，无需依赖现有网络图像。该功能采用“Nano Banana2Lite”模型，优先保障速度与成本而非极致画质，目前仅限英语用户，预计未来几周内推出。

2026年7月15号 10:09

440

苹果联手初创公司，力推 AI 模型压缩技术，让 iPhone 也能跑大型 AI！

苹果正与硅谷初创公司PrismML洽谈AI模型压缩技术，目标是将大模型压缩至iPhone本地运行，以提升隐私并推动Siri升级。PrismML CEO透露苹果已开始评估可行性，洽谈尚处早期。

2026年7月15号 9:02

320

马斯克亲口承认Grok Build偷传用户代码，承诺历史数据全部清零不留一个字节

马斯克承认Grok Build隐私风波属实，承诺彻底删除此前上传至SpaceXAI的用户数据，“一个字节不留”。事件源于安全研究员钓鱼测试，揭露该AI编程助手暗地传输声称仅本地处理的数据。这是AI巨头首次公开认账并清空数据。

2026年7月14号 16:00

690

抖音电商将豆包纳入抖店结算序列，GEO全面进入成交归因时代

抖音电商战略调整，将AI应用“豆包”纳入技术服务费规则，明确费率根据商品类目与成交渠道综合确定。这意味着豆包不再仅是前端购物入口，来自该渠道的订单将在商家结算侧被正式识别归因，新规于2026年7月15日生效。

2026年7月13号 13:54

1.4k

字节跳动 Seedance2.5模型将于7月16日全量开放 API

字节跳动视频生成模型Seedance2.5将于7月16日全量开放API，正式商用，降低高品质视频生成门槛。此前6月23日发布，预告7月初终落地。旗下即梦预热，将推会员折扣。

2026年7月10号 10:05

1.1k

阶跃星辰首款AI智能体手机即将发布，跑在OpenAI前面

阶跃星辰宣布将推出新一代智能体终端，发布AI终端品牌、智能体系统及首款AI智能体手机，成为全球大模型企业中率先落地的原生智能体手机，上市节奏早于OpenAI规划。该手机由华勤技术代工，双方形成深度绑定合作关系。

2026年7月9号 14:36

1.3k

智谱完成约314亿港元配售资金将用于大模型技术研发与算力建设

智谱完成约314.1亿港元配售，资金用于基座模型研发、算力建设、商业化及全球生态布局。公司强调长期竞争力取决于底层技术突破，其核心基座模型GLM-5.2已进入全球前沿竞争区间。

2026年7月9号 10:33

570

Cloudflare联手OpenAI，AI搜索技术迎来新突破

Cloudflare与OpenAI启动研究试点，旨在利用Cloudflare全球网络数据，提升AI搜索引擎检索内容的实时性与准确性。此举将助OpenAI模型快速捕捉网络最新动态，攻克生成式AI信息获取难的关键痛点。

2026年7月9号 10:14

560

AI创作新高度：字节跳动发布Seedream 5.0 Pro，开启交互式精准编辑时代

字节跳动发布多模态AI模型Seedream5.0Pro，推动图像创作从生成迈向设计。该模型在图文匹配、结构合理性、文字渲染和画面质感上显著提升，并重点突破复杂信息可视化能力，能精准解析意图，将数据、概念和密集文字转化为专业视觉呈现。

2026年7月9号 10:03

1.2k

AI日报：Claude Cowork登陆网页和手机端；美国放行GPT-5.6；Meta超级智能实验室首发图像生成模型

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://app.aibase.com/zh1、Meta超级智能实验室首发图像生成模型：MuseImage免费登陆Instagram和WhatsAppMeta超级智能实验室推出了首个图像生成模型MuseImage，该模型已通过MetaAI应用免费提供，并同步登陆Instagram和WhatsApp。近九成玩家会在购买前查看AI相关披露信息，但多数人并不将其作为购买决策的关键因素。

2026年7月8号 16:46

AI新闻资讯

最新AI日报

AI 商用·开源产品库

AI 产品排行榜

AI产品提交

AI工具导航

GEO 品牌全景分析

GEO 品牌得分检测

GEO 排名查询

GEO 排名监测

AI 对话问题挖掘

GEO 推广链接检测

站点AI友好度检测

GEO排名优化系统源码

GEO 排名优化服务

MCP服务端

MCP客户端

MCP教程与实践

MCP排行榜

MCP服务提交

MCP实验场

MCP服务调试器

大模型API聚合平台

模型库

模型供应商

大模型排行榜

大模型API中转站检测

大模型选型对比

大模型费用计算器

大模型竞技场

模型个人电脑配置检测器

模型部署服务器配置计算器

字节发布创新图像合成技术XVerse：对多个个体进行独立且精确的控制

AIbase基地

本文来自AIbase日报

相关AI新闻推荐

谷歌搜索引入“无结果生图”:AI 概览变身创意画布，恐分流网站流量

苹果联手初创公司，力推 AI 模型压缩技术，让 iPhone 也能跑大型 AI！

马斯克亲口承认Grok Build偷传用户代码，承诺历史数据全部清零不留一个字节

抖音电商将豆包纳入抖店结算序列，GEO全面进入成交归因时代

字节跳动 Seedance2.5模型将于7月16日全量开放 API

阶跃星辰首款AI智能体手机即将发布，跑在OpenAI前面

智谱完成约314亿港元配售 资金将用于大模型技术研发与算力建设

Cloudflare联手OpenAI，AI搜索技术迎来新突破

AI创作新高度：字节跳动发布Seedream 5.0 Pro，开启交互式精准编辑时代

AI日报：Claude Cowork登陆网页和手机端；美国放行GPT-5.6；Meta超级智能实验室首发图像生成模型

相关AI新闻推荐

谷歌搜索引入“无结果生图”:AI 概览变身创意画布，恐分流网站流量

苹果联手初创公司，力推 AI 模型压缩技术，让 iPhone 也能跑大型 AI！

马斯克亲口承认Grok Build偷传用户代码，承诺历史数据全部清零不留一个字节

抖音电商将豆包纳入抖店结算序列，GEO全面进入成交归因时代

字节跳动 Seedance2.5模型将于7月16日全量开放 API

阶跃星辰首款AI智能体手机即将发布，跑在OpenAI前面

智谱完成约314亿港元配售 资金将用于大模型技术研发与算力建设

Cloudflare联手OpenAI，AI搜索技术迎来新突破

AI创作新高度：字节跳动发布Seedream 5.0 Pro，开启交互式精准编辑时代

AI日报：Claude Cowork登陆网页和手机端；美国放行GPT-5.6；Meta超级智能实验室首发图像生成模型

智谱完成约314亿港元配售资金将用于大模型技术研发与算力建设

智谱完成约314亿港元配售资金将用于大模型技术研发与算力建设