AI新闻资讯

AI资讯

不错过全球AI革新的每一个时刻

AI日报

每天三分钟关注AI行业趋势

AI时间线

AI行业大事记

Al硬件

列出所有AI硬件产品。

AI变现指南

图片合集

AI图片制作变现案例分享

视频合集

AI视频制作变现案例分享

音频合集

AI音频制作变现案例分享

文案合集

AI内容写作变现案例分享

AI教程

AI产品榜

AI产品排行榜

展示AI网站的总访问量排名

AI产品流量增速榜

追踪AI网站访问量增长最快产品

AI产品流量下降榜

关注访问量下降明显的AI网站

AI产品周榜

展示AI网站的周访问量排名

AI开源项目库

全景图

github热门AI开源项目总览

产品库工具导航 MCP

Be Yourself：有效防止SD图像生成过程中提示词概念相互污染

站长之家

发布于AI新闻资讯 · 1 分钟阅读 · Mar 27, 2024

近日，一个名为Be Yourself的项目在解决SD图像生成中的提示词概念污染问题方面取得了突破。通过采用有界注意力的方法，该项目有效防止了提示词概念的相互污染，提高了生成图像的质量。这一创新将为用户带来更好的视觉体验，使生成的图像更具独特性。

图像生成提示词概念

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

通义千问发布多模态统一理解与生成模型Qwen VLo

近日，Qwen VLo多模态大模型正式发布，该模型在图像内容理解与生成方面取得了显著进展，为用户带来了全新的视觉创作体验。据介绍，Qwen VLo在继承原有Qwen-VL系列模型优势的基础上，进行了全面升级。该模型不仅能够精准“看懂”世界，更能基于理解进行高质量的再创造，真正实现了从感知到生成的跨越。用户现在可以在Qwen Chat（chat.qwen.ai）平台上直接体验这一新模型。

2025年6月28号 9:38

2.8k

可灵AI推出“视频音效”功能，实现“所见即所听”沉浸体验

可灵AI近日宣布，其全系列视频模型已正式上线**“视频音效”功能**，为用户带来革命性的沉浸式体验。现在，用户在生成视频的同时，可以同步生成立体声音效，真正实现“所见即所听”。不仅如此，平台原有的“音效生成”功能也得到了升级，新增了**“视频生音效”模块**。这意味着用户可以上传自己的视频或调用历史作品，一键匹配合适的音效。这项功能的强大之处在于，它基于可灵自研的多模态视频生音效模型 Kling-Foley，能够实现音画的帧级对齐，确保音效与画面内容高度同步。

2025年6月27号 15:45

2.1k

惊天内幕！Anthropic 因训练 AI 销毁数百万本书籍，版权纠纷再升级！

生成式人工智能因其可靠性不足、巨大能耗以及未经授权使用版权材料而备受争议。然而，最近一起针对人工智能公司 Anthropic 的法庭案件揭示了一个更令人震惊的真相:为了训练其 AI 助手，该公司竟然销毁了数百万本实体书籍。在这起案件中，法官发现 Anthropic 为构建其语言模型 Claude，进行了大规模的书籍销毁行为。这家科技公司购买了大量实体书籍，随后通过撕下装订线和扫描书页的方式将其数字化，这一过程不仅彻底毁坏了这些书籍，还没有打算将最终的数字版本公开。这样的做法在

2025年6月27号 15:24

2.9k

OpenAI宣布2025年开发者大会将在旧金山举办，预计吸引1500多名开发者参与

OpenAI 已正式公布了其下一届开发者大会（DevDay）的时间和地点，定于2025年10月6日在旧金山举行。这次大会将吸引超过1500名开发者参加，预计将成为迄今为止规模最大的一次开发者活动。此次 DevDay 的议程丰富多彩，包含多个重要环节。大会将设有现场直播的主题演讲，届时将分享 OpenAI 在人工智能领域的最新进展和未来愿景。此外，参与者还可以参加针对最新模型和工具的实操工作坊，获取第一手的使用体验。与去年相比，今年的活动将增加更多的舞台和展示环节，确保每位与会者都能获

2025年6月27号 14:31

1.7k

谷歌推出实验性AI试穿应用 Doppl:虚拟时尚新体验

谷歌于本周四在美国iOS和Android平台推出了一款名为 Doppl 的实验性新应用，旨在通过人工智能技术，让用户直观地看到不同服装穿在自己身上的效果。这款应用利用AI生成用户穿着服装的虚拟形象，甚至能将静态图像转换为动态视频，为用户提供沉浸式的试穿体验。Doppl 的核心功能在于允许用户上传自己的全身照片，然后通过导入服装照片或截图，在自己的数字版本上进行虚拟试穿。无论是你在旧货店发现的心仪服装，还是社交媒体上的时尚灵感，都能通过Doppl轻松呈现。用户不仅可以保存

2025年6月27号 14:22

2.2k

ElevenLabs推出Voice Design v3 只需一句话，生成任何你想要的声音

近日，AI语音技术领域的领军企业ElevenLabs正式发布其最新语音设计工具Voice Design v3，为内容创作者和开发者带来了前所未有的语音生成体验。据AIbase了解，这款工具通过简单的文本提示即可生成高度拟人化的语音，支持70多种语言和数百种本地化口音，极大地提升了语音的表达力和真实感。Voice Design v3的发布标志着AI语音技术在个性化和情感表达方面的重大突破。一键生成个性化语音，创意无限Voice Design v3的核心亮点在于其文本提示生成能力。用户只需输入一段描述性文字，例如“一个来自

2025年6月27号 14:05

2.2k

一键生成爆款视频！HeyGen AI视频Agent席卷内容创作界！

近日，AI视频生成领域的领军企业HeyGen推出了一款革命性的AI视频Agent，为视频内容创作带来了全新突破。据AIbase了解，这款AI视频Agent能够通过简单的素材上传，自动完成从故事规划、脚本编写到镜头选择的整个视频制作流程，让用户在几分钟内即可获得可直接发布的专业级视频内容。这一创新功能不仅大幅降低了视频创作门槛，还为广告、短视频、产品演示等场景提供了高效解决方案。一键创作，智能高效HeyGen AI视频Agent的核心亮点在于其全自动视频生成能力。用户只需上传图片、视频片

2025年6月27号 10:07

3.3k

标谷歌推出 Doppl 应用，让你轻松体验虚拟试衣

近日，谷歌正式推出了一款名为 Doppl 的 AI 试衣应用，旨在为用户提供一种全新的虚拟试穿体验。通过这款应用，用户只需上传一张全身照片，就可以选择自己喜欢的服装进行试穿，无论这些服装来自旧货店、朋友的穿搭，还是社交媒体上的图片，都能轻松实现。Doppl 的操作流程非常简单。用户首先需要将自己的全身照上传到应用中。接着，可以通过上传其他服装的照片或截图，来进行虚拟试穿。应用会基于用户的形象生成相应的试穿效果图，帮助用户在自己的数字化身上查看衣物的搭配

2025年6月27号 9:10

1.8k

Black Forest震撼开源FLUX.1 Kontext [dev]：媲美GPT-4o的图像编辑

Black Forest Labs正式宣布，其全新图像编辑模型 FLUX.1Kontext [dev] 现已开源，引发了AI社区的广泛关注。这一模型作为FLUX.1系列的最新成员，以其强大的图像编辑能力和高效性能被誉为可媲美GPT-4o的开源替代方案。FLUX.1Kontext [dev] 基于12亿参数的流匹配变换器架构，专为图像编辑任务设计，支持消费级硬件运行，为创作者、开发者和研究人员提供了前所未有的灵活性。核心功能:上下文感知与精准编辑FLUX.1Kontext [dev] 的最大亮点在于其上下文感知图像生成与编辑能力。与传统仅基于文本提示的图像

2025年6月27号 8:54

2.9k

开源神器来了！FLUX.1 Kontext [dev]挑战GPT-4o，图像编辑进入新时代

近日，Black Forest Labs宣布正式开源其最新图像编辑模型FLUX.1Kontext [dev]，这一拥有120亿参数的AI模型被誉为对标OpenAI GPT-4o和Google Gemini的强力竞争者。据AIbase了解，该模型专为图像编辑任务设计，兼具高性能与易用性，不仅能在消费级硬件上高效运行，还为用户提供了前所未有的图像编辑体验。多场景精准编辑，角色一致性无与伦比FLUX.1Kontext [dev]以其强大的迭代编辑、角色保持以及局部与全局精细控制能力脱颖而出。无论是为人物添加帽子、替换背景风景，还是将图片中的狗替换为猫，FLUX.1

2025年6月27号 8:52

2.6k

AI资讯

AI日报

AI时间线

Al硬件

最新案例

图片合集

视频合集

音频合集

文案合集

最新教程

AI产品排行榜

AI产品流量增速榜

AI产品流量下降榜

AI产品周榜

美国

中国

印度

巴西

图片生成

个人助理

角色生成网站

视频生成

AI项目榜单

AI项目增速榜

AI开发者排名

AI组织排名

deepseek

TTS

LLM

ChatGPT

全景图