谷歌DeepMind首席执行官德米斯·哈萨比斯2月26日表示,谷歌计划未来几周内重新推出Gemini AI模型人像生成功能,目前该功能已下线并在修复中,预计未来几周内可以重新上线。Gemini AI模型的重新推出将给人像生成带来更多可能性。
相关AI新闻推荐

AI育儿视频:如何利用热门话题和AI工具实现日入600+,详细步骤拆解
赚钱思路利用AI工具制作育儿对话视频,发布到视频平台,通过流量分成、账号出售和教程销售等方式变现。适合人群有育儿经验的家长、喜欢视频创作的年轻人、对 AI 技术有基本了解的人。上手难度中等,需掌握 AI 工具的使用以及视频编辑软件。操作流程方法** 第一步:寻找对标视频 **打开轻抖小程序,浏览相关育儿视频。找到你感兴趣的视频,提取其中的文案。** 第二步:生成新文案 **将提取的文案粘贴到豆包中。添加提示:“请根据以上文案内容和结构,仿写一段新的文案。”** 第三步

百度重磅开源文心大模型 4.5 系列,十款新模型亮相!
百度正式发布了文心大模型4.5系列模型,并且将其完全开源。用户可以通过文心一言(https://yiyan.baidu.com)立即体验这一最新的开源技术。 这一系列模型涵盖了多种参数配置,包括激活参数为47B 和3B 的混合专家(MoE)模型,以及稠密型模型0.3B 参数的设计,合计达到了十款不同的模型。在训练和推理方面,文心4.5系列模型使用了飞桨深度学习框架,达到47% 的模型 FLOPs 利用率。实验结果显示,该系列模型在多项文本和多模态基准测试中表现优异,尤其是在指令遵循、世界知识记忆、视觉理

飞利浦重磅推出 8 号 Pro AI 耳机,解锁多语言沟通新体验!
在近日于西安举行的2025新品发布会上,飞利浦影音及配件公司推出了三款颠覆性产品,吸引了众多科技爱好者的关注。这些新产品包括专为年轻白领和 Z 世代打造的 “刀片” 磁吸充电宝、针对商务精英的8号 Pro AI 耳机以及适合家庭娱乐的 KTV・云・音箱。这一系列创新产品不仅彰显了飞利浦在消费电子领域的领导地位,也标志着其在中国市场开辟了全新的赛道。其中,最引人瞩目的当属8号 Pro AI 耳机。这款耳机采用了腾讯的混元 AI 语言大模型,能够精准支持17种语言的互译和27种方言的识

重磅消息!GPT-5 即将登场,带你体验全新多模态 AI 时代!
近日,关于 OpenAI 即将发布的 GPT-5的消息引发了科技界的广泛关注。据内部人士透露,GPT-5已经开始灰度测试,预计将在今年7月正式上线。这一代新模型将采用多模态设计,意味着它不仅能够处理文字输入,还能理解语音、图像、代码甚至视频,彻底改变我们与 AI 的互动方式。OpenAI 的首席执行官 Sam Altman 表示,GPT-5的推出将标志着 AI 技术的一次重大飞跃。这款新模型具备深度推理能力,能够进行实时视频生成,并且能够编写大量代码,进一步拓展了 AI 的应用场景。与之前的版本相比,GPT

Gemini2.5Pro API 免费回归,开发者社区热烈响应
近日,谷歌宣布其旗舰AI模型Gemini2.5Pro的API重新纳入Google AI Studio的免费层级,这一消息引发了开发者社区的广泛关注和热烈讨论。根据AIbase报道,这一举措标志着谷歌在AI技术普及化方面的又一重要进展,为开发者提供了更低门槛的创新机会。Gemini2.5Pro作为谷歌迄今为止最先进的AI模型,以其卓越的多模态能力和强大的推理性能而闻名。该模型支持高达100万token的上下文窗口,能够处理文本、图像、音频和视频等多种输入类型,在编码、复杂推理和数据分析等任务中表现尤为突出。此前,谷

百度文心系列大模型在飞桨平台开源,涵盖多款最新模型
百度旗下文心系列大模型近日已在其飞桨(PaddlePaddle)平台开源,其中包括 ERNIE-4.5-VL-424B-A47B-Paddle 和 ERNIE-4.5-300B-A47B-Paddle 等数十款最新模型。尽管百度方面尚未主动披露此次开源行动,但飞桨平台的更新信息显示,这一系列动作集中在6月29日至6月30日,是其最新的举措。有内部人士证实:“官网上新并公布了开源代码,足见公司确实已在推进开源举措。”此次开源,将使更多开发者和研究者能够利用百度文心系列大模型的强大能力,推动人工智能技术的发展和应用。

显存优化!英伟达 DLSS 4 让游戏更流畅,Transformer 模型显存减少 20%
在游戏性能日益提升的今天,英伟达再次引领了显卡技术的潮流。最新发布的 DLSS4SDK,不仅正式上线,还在显存(VRAM)的使用上进行了重大优化,让玩家们在享受高质量游戏画面的同时,显卡的负担也大大减轻。根据相关报道,英伟达在最新的 DLSS310.3.0版本中,对 Transformer 模型的显存占用进行了20% 的优化。之前,DLSS 的 Transformer 模型在显存使用上几乎是传统 CNN 模型的两倍,这让不少玩家在高分辨率游戏时感到压力。然而,经过优化后,Transformer 模型的显存占用仅比 CNN 模型多出40%。在1

阿里Ovis-U1震撼发布:多模态AI三合一,开源赋能全球开发者
2025年6月29日,阿里巴巴国际AI团队正式发布了全新多模态大模型 **Ovis-U1**,标志着其在多模态人工智能领域的又一重大突破。作为Ovis系列的最新力作,Ovis-U1将多模态理解、图像生成和图像编辑功能融为一体,展现了强大的跨模态处理能力,为开发者、研究者和行业应用提供了全新的可能性。以下是AIbase对Ovis-U1的详细报道。Ovis-U1:三合一的多模态统一框架Ovis-U1是阿里巴巴国际AI团队基于Ovis系列架构打造的3亿参数模型,首次实现了多模态理解、文生图像和图像编辑的统一。据AIbase了解,该模

腾讯开源 Hunyuan-A13B:小尺寸,大智慧的 AI 模型
Hunyuan-A13B 是一个由腾讯最新开源的大语言模型,它以创新的设计理念,在相对较小的活跃参数规模下,实现了强大的性能表现,特别适用于资源受限的环境。这款模型采用了细粒度 MoE(Mixture-of-Experts)架构,拥有130亿活跃参数,但总参数量高达800亿。这种设计让它在保持高效和可扩展性的同时,能够提供前沿的推理能力和通用应用支持。Hunyuan-A13B 的核心功能亮点包括:支持快慢思维的混合推理模式:这种独特的推理机制让模型能够根据任务需求灵活调整思考深度,提升处理复杂问题的效率

Runway AI重磅推出“游戏世界” 大型互动文本冒险来了
近日,AI技术先锋企业Runway宣布即将推出其全新生成式AI平台“游戏世界”(Game Worlds),这一创新产品不仅标志着Runway从影视领域的成功拓展至游戏行业,更为广大创作者和玩家带来了全新的互动体验。“游戏世界”:AI驱动的互动文本冒险Runway的“游戏世界”平台以生成式AI为核心,允许用户通过简单的文字输入即可创建并体验基于文本的冒险游戏。与传统游戏开发需要大量资源和专业技能不同,该平台通过AI自动生成游戏的文本叙述和配套图像,大幅降低了创作门槛。用户只需提供游戏世