近日,图像生成应用Playground进行了大改版,新的版本变得更加实用和便捷。比如,你可以在海报上添加新的文字,或是调整现有文字的位置和样式。比如,上传一张风景照后,你可以用文字指令删除不需要的树木,或是添加一些新的元素。更多信息请访问官方页面:Playground
用户现在可以选择海报、Logo、T恤等常见设计需求,从模版选择开始,也可以自己生成全新的设计。这种功能大大提升了设计的灵活性,满足了用户多样化的需求。这种功能极大地方便了用户进行细致的图像编辑工作。
近日,图像生成应用Playground进行了大改版,新的版本变得更加实用和便捷。比如,你可以在海报上添加新的文字,或是调整现有文字的位置和样式。比如,上传一张风景照后,你可以用文字指令删除不需要的树木,或是添加一些新的元素。更多信息请访问官方页面:Playground
用户现在可以选择海报、Logo、T恤等常见设计需求,从模版选择开始,也可以自己生成全新的设计。这种功能大大提升了设计的灵活性,满足了用户多样化的需求。这种功能极大地方便了用户进行细致的图像编辑工作。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
近日,百度商业研发团队于7月2日宣布推出一款革命性的视频生成模型 “MuseSteamer”,并同时发布了创作平台 “绘想”。这一创新的技术标志着全球首个实现中文音视频一体化生成的模型正式问世,必将为内容创作领域带来深远的影响。MuseSteamer 的最大亮点在于其卓越的协同创作能力,能够将画面、音效以及人声台词完美结合,生成高质量的视频内容。根据官方介绍,该模型在权威榜单 VBench I2V 中获得了89.38% 的总分,荣登全球第一。这一成绩不仅体现了其强大的技术实力,也为内容创作者
在人工智能领域,尤其是生成式对抗网络(AIGC)方面的不断进展,语音交互已成为一个重要的研究方向。传统的大语言模型(LLM)主要专注于文本处理,无法直接生成自然语音,这在一定程度上影响了人机音频交互的流畅性。为了突破这一局限,Step-Audio 团队开源了一款全新的端到端语音大模型 ——Step-Audio-AQAA。该模型能够直接从原始音频输入生成自然流畅的语音输出,使得人机交流更加自然。Step-Audio-AQAA 的架构由三个核心模块组成:双码本音频标记器、骨干 LLM 和神经声码器。其中,双码本
在今日举行的百度AIDAY科技开放日上,百度商业研发团队正式发布了其自主研发的视频生成模型MuseSteamer及其配套的视频产品平台**“绘想”**。这一创新旨在通过“生成式AI+多模态技术”打造全面的视频生成解决方案,以满足搜索、广告、推荐等场景对原生化内容生产的强劲需求。MuseSteamer视频生成模型系列丰富,目前包含Turbo、Lite、Pro以及全系列有声版本。其中,Turbo版已率先上线“绘想”平台并开启限时免费公测,其余版本预计将于今年8月陆续面向用户开放。据悉,MuseSteamer的核心亮点
谷歌的智能语音助手 Gemini Live 正迎来重大升级。根据近期网络上的最新信息,Gemini Live 即将实现与多种 Google 应用的深度整合,进一步提升其在日常生活中的实用性和智能化水平。这一更新将使 Gemini Live 成为更强大的生产力工具,满足用户多样化的需求。以下是 AIbase 对这一动态的整理与分析。Gemini Live 扩展应用连接,功能再升级近期,谷歌通过其 Android 应用的最新测试版(版本号16.25.44.sa.arm64)透露,Gemini Live 将新增对多个热门应用的扩展支持,包括 Google Maps、Google Calendar、Google Keep、G
在近日的百度AI Day开放日上,百度搜索宣布进行了其十年来最大规模的改版,此次革新涵盖了搜索框、搜索结果页以及整个搜索生态。此举是百度积极顺应行业发展趋势,拓宽搜索能力边界的一次主动变革。升级后的百度搜索框被命名为“智能框”,显著增强了其输入能力,现在可支持超过千字的文本输入。同时,拍照、语音、视频等多种输入方式也得到全面加强,并能直接调取AI写作、AI作图等创作工具,极大地丰富了用户与搜索的交互方式。“百看”功能也在此次改版中实现了全面升级
随着人工智能技术的飞速发展,Google旗下的人工智能助手Gemini Live迎来了一次重大升级。根据AIbase最新获取的信息,Gemini Live即将实现与多种Google应用的深度整合,为用户带来更加智能、高效的交互体验。这一功能不仅提升了生产力,还将彻底改变用户与Google生态系统的交互方式。无缝连接Google应用,智能操作更便捷最新消息显示,Gemini Live将能够访问并操作Google生态中的多项核心应用,包括Google Maps、Google Calendar、Google Keep和Google Tasks等。这一升级意味着用户可以通过语音或文字指令,直接
在近期的百度AIDAY科技开放日活动上,百度商业研发团队正式宣布推出两项重磅创新成果:自研视频生成模型MuseSteamer和全新的视频产品平台**“绘想”**。MuseSteamer作为百度自主研发的视频生成模型,标志着百度在人工智能生成内容(AIGC)领域,特别是在视频创作方面取得了重要进展。而同步发布的视频产品平台“绘想”,则将为用户提供一个集成化的工具,有望降低视频创作门槛,提升内容生产效率。此次发布,体现了百度在AI技术赋能商业应用方面的持续投入与布局,预示着视频内容创
据 The Information 报道,OpenAI 正在加大其企业 AI 咨询业务的力度,收费标准至少为每位客户1000万美元。公司工程师直接与各组织合作,调整如 GPT-4o 等模型以适应其特定数据,并构建定制应用程序,包括聊天机器人等。这一举措使 OpenAI 与诸如 Palantir 和 Accenture 等知名企业展开直接竞争。图源备注:图片由AI生成,图片授权服务商MidjourneyOpenAI 提供的服务不仅限于模型定制,还包括数据标注服务。在这一过程中,专家会对 AI 生成的答案进行审核和修正。内部消息人士透露,OpenAI 正在考虑将部分
近日,社交平台 X(原 Twitter)宣布将试点一项新功能,允许人工智能(AI)聊天机器人生成 “社区笔记”。这一功能源自于 Twitter 时代的社区笔记系统,经过埃隆・马斯克的扩展和优化,旨在提升平台上信息的准确性与透明度。什么是社区笔记?简单来说,社区笔记是一个由用户主导的事实核查项目。参与该项目的用户可以对特定帖子添加评论,帮助提供更详细的背景信息,这些笔记在发布前需要经过其他用户的审核。例如,某个 AI 生成的视频如果没有清楚标明其来源,社区笔记就可以对此
AIbase 报道,设计软件公司 Figma 于本周二公开了其 S-1财务文件,标志着该公司向首次公开募股(IPO)迈出了关键一步。尽管此次文件中尚未披露具体的发行数量和发行价格,但它为外界提供了迄今为止最清晰的 Figma 财务状况及未来潜力全貌。Figma 财务状况亮眼,IPO 规模或超15亿美元IPO 专家 Renaissance Capital 预计,Figma 本次 IPO 融资额有望高达15亿美元。如果成功达到或超过这一数字,Figma 将有望与2025年迄今最大规模的科技 IPO——CoreWeave(融资15亿美元)并驾齐驱。Figma 令人印象深刻的财务数