谷歌Gemini的人像生成功能被暂停并将重新上线。Gemini的人像生成功能出现问题,提供了不准确的信息。谷歌正在修复问题并计划发布改进版本,以解决Gemini图像生成功能的相关问题。
相关AI新闻推荐

豆包上线视频通话功能:支持实时互动 融合视觉语言输入能力
豆包官方正式宣布豆包App推出实时视频通话功能。这一新功能的上线,为用户带来了全新的交互体验。 当用户在豆包App电话界面开启视频画面后,豆包便能依据真实场景与用户展开实时问答互动。其背后的模型具备融合视觉与语言输入的能力,可进行综合的深度思考和创作。

谷歌Beam发布!2D视频秒变3D沉浸式体验,实时翻译+真实眼神交流
Google I/O大会上,Google正式推出了其革命性的3D视频通信平台——Google Beam。这一平台以人工智能为核心,将传统的2D视频通话升级为身临其境的3D体验,旨在让远程沟通如同面对面般真实自然。AIbase为您带来这一前沿科技的最新资讯,解析其技术亮点与未来潜力。从 Project Starline 到 Google Beam:技术进化的里程碑Google Beam脱胎于2021年首次亮相的Project Starline研究项目。过去几年,Google不断优化其3D视频通信技术,如今以更成熟的形态推出Google Beam。相较于传统视频会议系统,Google Beam通过先进的硬

微软记事本Notepad推出 AI 写作功能,助力用户快速创作
微软近期宣布,在Notepad记事本中推出一项全新的 AI 写作功能,旨在帮助用户更快速地撰写文本。这项功能正在 Windows11的最新更新中进行测试,当前仅在 Canary 和 Dev 频道的 Windows Insiders 用户中可用,适用于配备 Co pilot Plus 的 PC。根据 Windows Insider 博客的介绍,记事本的新 “写作” 功能可以根据用户的提示快速生成文本,也可以在已有内容的基础上进行扩展。用户可以通过右键点击希望插入新文本的位置,或者在选择已有文本后进行操作。选择 “写作” 功能后,会弹出一个提示框,用户可

Anthropic API增加四大功能:代码执行工具、MCP连接器、文件API和扩展提示缓存
Anthropic宣布在其API上推出四项全新功能:代码执行工具、MCP连接器、文件API以及扩展提示缓存,旨在帮助开发者构建更智能、更高效的AI代理。代码执行工具:从代码助手到数据分析师Anthropic推出的代码执行工具赋予了Claude在沙盒环境中运行Python代码的能力,使其从单纯的代码编写助手升级为强大的数据分析师。这一功能支持Claude直接在API调用中执行数据分析、生成可视化图表,并处理复杂计算任务。例如,开发者可以利用Claude进行实时数据处理或生成动态可视化内容,大幅提升AI在数据驱动

太卷了!Anthropic发布Claude 4 编程和推理能力秒杀Gemini2.5pro
最近,人工智能界传来重大消息,Anthropic 正式推出了其 Claude4系列模型,包括 Claude Opus4和 Claude Sonnet4。这次发布并没有华丽的口号或冗长的论文,关键词只有一个 ——“干活”。根据 Anthropic 的说法,Claude Opus4被誉为全球最强的编程模型,能够稳定处理复杂且长期的任务,表现出色。而 Claude Sonnet4则在编程和推理能力上进行了强化,可以更加精准地回应用户的指令。Claude4系列带来了多项令人期待的新功能。首先,模型能够在进行深入思考时使用辅助工具,从而优化推理过程和回复质量。

Framer发布全新AI功能,Wireframer秒建网站,Workshop生成交互组件,Vectors 2.0与A/B测试引爆设计新热潮!
Framer在I/O2025期间宣布推出全新AI功能套件,包括Wireframer、Workshop、Advanced Analytics和Vectors2.0,通过AI驱动的网站布局生成、交互组件设计、矢量绘图升级和高级分析工具,显著降低了网站创建的成本和复杂度。这些功能面向所有用户开放,无需Beta测试,引发全球设计师和开发者社区的热烈反响。AIbase综合最新社交媒体动态,深入解析Framer新功能的技术亮点及其对网站设计领域的深远影响。Wireframer:AI秒建网站布局Wireframer是Framer推出的智能布局助手,允许用户通过自然语言提示快速生成网站基

谷歌DeepMind发布新AI音乐生成模型Lyria2,支持实时创作
谷歌DeepMind正式发布了其最新音乐生成模型 Lyria2,标志着人工智能在音乐创作领域的又一重大突破。作为前代Lyria模型的升级版本,Lyria2以其高保真音质、实时交互功能和多风格适配性,为音乐家、制作人和内容创作者提供了前所未有的创作工具。高保真音质,捕捉音乐细微之美Lyria2在音质表现上实现了显著突破,能够生成48kHz立体声音频,达到专业级水准。无论是古典音乐的优雅旋律,还是电子音乐的动态节奏,Lyria2都能精准捕捉不同乐器和演奏风格的细微差别。据谷歌DeepMind介绍,该模

谷歌推出新工具SynthID Detector ,助力识别AI生成内容
谷歌最近在其 Google I/O 活动上宣布了一款名为 SynthID Detector 的新工具,旨在帮助用户检查内容是否由其 AI 工具生成。谷歌 DeepMind 的 Pushmeet Kohli 在一篇博文中表示,SynthID Detector 是一个 “验证门户”,可以 “快速有效地识别使用谷歌 AI 制作的内容”。这款工具的独特之处在于,它不仅可以识别 AI 生成的内容,还能够突出显示哪些部分更可能带有 SynthID 水印。SynthID 水印适用于通过谷歌的多个 AI 模型生成的图像、文本、音频和视频,包括 Gemini、Imagen、Lyria 和 Veo 等模型。使用该工具时,用

OpenAI Responses API新增MCP支持与多项功能升级,助力智能体开发
OpenAI宣布其核心API——Responses API现已支持**Model Context Protocol(MCP)**,并对图像生成、Code Interpreter以及文件搜索工具进行了重大更新。这些升级极大简化了智能体开发流程,使开发者能够通过几行代码将AI智能体连接到外部工具和服务,进一步提升了API的灵活性和功能性。 MCP支持:简化智能体开发OpenAI通过Responses API新增对MCP的支持,标志着其在AI智能体开发领域的又一重大突破。MCP(Model Context Protocol)是一种连接AI模型与外部工具和服务的协议,开发者只需数行代码即可实现复杂的功能集

谷歌Sparkify实验产品上线,输入问题秒变动画短片,复杂知识秒懂
谷歌推出全新实验性AI产品Sparkify,通过Gemini与Veo模型,用户只需输入一个问题或复杂概念,即可在2分钟内生成直观的动画短视频,深入浅出地讲解知识点。从“珍珠奶茶的起源”到“8小时工作制的演变”,Sparkify以其创新的教育应用场景和高效的知识传播方式引发热议。AIbase综合最新社交媒体动态,深入解析Sparkify的技术亮点及其对教育与内容创作领域的深远影响。内测申请地址:https://sparkify.withgoogle.com/exploreSparkify:从问题到动画的智能转化Sparkify是谷歌基于Gemini2.5和Veo2模型打造的AI驱动