谷歌Gemini人像生成功能关闭,AI专家Yann LeCun发表看法

机器之心
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
最近,人工智能界传来重大消息,Anthropic 正式推出了其 Claude4系列模型,包括 Claude Opus4和 Claude Sonnet4。这次发布并没有华丽的口号或冗长的论文,关键词只有一个 ——“干活”。根据 Anthropic 的说法,Claude Opus4被誉为全球最强的编程模型,能够稳定处理复杂且长期的任务,表现出色。而 Claude Sonnet4则在编程和推理能力上进行了强化,可以更加精准地回应用户的指令。Claude4系列带来了多项令人期待的新功能。首先,模型能够在进行深入思考时使用辅助工具,从而优化推理过程和回复质量。
在最近的一次公开讲话中,谷歌的 CEO 桑达尔・皮查伊透露,公司的 Gemini AI 应用程序的月活跃用户数量已经超过4亿。这一数据的公布无疑为 Gemini AI 的成功增添了光彩,并显示出消费者对这一人工智能技术的强烈兴趣。Gemini AI 不仅在用户量上取得了显著的成绩,还在全球范围内实现了广泛的覆盖。根据皮查伊的介绍,该 AI 应用已经在200多个国家和地区正式推出,服务范围涵盖了超过15亿的用户。这意味着,Gemini AI 能够为来自不同文化和语言背景的用户提供便利,进一步推动了全球化的步
在2025年5月20日的Google I/O开发者大会上,谷歌宣布其AI编码助手Jules正式进入全球公测阶段,面向所有拥有Google和GitHub账户的开发者开放。这一基于Gemini2.5Pro模型的异步编码代理,旨在通过自动化处理繁琐的编码任务,如修复Bug、编写测试和更新依赖,提升开发者效率。异步任务处理与GitHub无缝集成Jules通过在Google Cloud虚拟机(VM)中克隆用户代码库,异步执行编码任务,开发者可在提交任务后专注于其他工作。无论是修复Bug、编写单元测试、更新依赖版本,还是实现新功能,Jules都能生成多
在2025年5月20日的Google I/O开发者大会上,谷歌DeepMind正式推出了Gemini2.5Pro Deep Think模式,这一实验性增强推理模式为AI处理复杂任务树立了新标杆。Deep Think模式通过并行推理技术,使Gemini2.5Pro在数学、编码和多模态推理等领域的表现达到行业领先水平。并行推理技术,显著提升复杂任务表现Deep Think模式采用前沿的并行推理技术,允许模型在生成响应前探索多个假设路径,从而提升答案的准确性和深度。谷歌表示,该模式在2025年美国数学奥林匹克(USAMO)测试中获得优异成绩,在竞争性编程基
在2025年的 I/O 开发者大会上,谷歌宣布其移动邮件应用 Gmail 将全面整合 Gemini AI 功能,为用户带来更便捷的日历管理体验。无论是 Android 还是 iOS 平台,用户都可以通过 Gmail 应用轻松创建、删除和编辑日历事件,并查看每日日程概览。据悉,这一新功能允许用户在 Gmail 内直接管理日历,无需切换到其他应用。用户只需点击 Gmail 应用中的 “Ask Gemini” 图标,就可以利用 Gemini 的智能助手进行日历事务的处理。这些操作虽然相对基础,但足以满足大多数用户的日常需求。谷歌表示,该功能目前
在最新举行的 Google I/O2025大会上,谷歌公布了其 AI 模型 Gemini2.5系列的重要更新。这一系列新版本包括了轻量级的 Gemini2.5Flash 和更强大的 Gemini2.5Pro,前者预计将在今年6月初正式推出。Gemini2.5Flash 是针对普通用户需求而设计的轻量级版本,相较于其前代产品,其效率提升了22%。更值得一提的是,这一新版本将具备显示思考过程的能力,这意味着用户在与 AI 进行互动时,可以更清晰地理解 AI 的推理逻辑。无论是进行日常查询还是复杂问题解决,Flash 都将提供更流畅和直观的体验。而 Gemini2.5
在近日召开的2025年 I/O 开发者大会上,谷歌宣布通过其新推出的 Gemini AI 技术,全面升级 Android Auto 车载系统。这一升级的核心目标是为驾驶者提供更加自然、流畅的语音交互体验,令他们在驾驶过程中无需动手即可完成多项操作。根据科技媒体 Android Central 的报道,谷歌在会议上展示了这一技术的预发布版本,并在沃尔沃汽车上进行了试用。反馈显示,Gemini AI 在自然语言处理方面的表现非常出色,即使用户用词模糊或表达不清,它也能够准确理解并执行指令。例如,用户只需说 “Gemini,
近日,在2025年 I/O 开发者大会上,谷歌宣布其最新功能 Gemini Live 正式向 iOS 和安卓用户开放。这项革命性的功能可以实时识别并回应用户手机摄像头和屏幕上的内容,进一步提升了人机交互的体验。最初,Gemini Live 只面向 Gemini Advanced 高级用户,但谷歌在今年4月宣布计划扩大其覆盖范围,现在,这一功能已经成功引入到 iOS 平台,成为所有用户的新玩具。只需简单地展示屏幕截图或用摄像头对准特定物体,Gemini Live 就能为用户提供精准的信息反馈。这种互动方式打破了传统的文字输入局限
谷歌宣布正式向全球所有用户推出Gemini网页版对话搜索功能,标志着其基于Gemini2.5的AI搜索体验进入全面普及阶段。这一功能允许用户通过自然语言进行多轮对话式搜索,取代传统关键词查询,提供更智能、直观的答案。谷歌同时透露,移动端对话搜索功能也将逐步上线,进一步扩展Gemini的覆盖范围。AIbase综合最新动态,深入解析这一功能的技术亮点及其对全球搜索生态的深远影响。对话搜索:从关键词到自然语言Gemini网页版对话搜索(Conversational Search)通过Gemini2.5Pro的多模态能力,彻底改
Google 正式宣布其人工智能驱动的笔记与研究助手工具 NotebookLM 推出 iOS 版本,与 Android 版本同步上线。这一消息恰逢 Google I/O2025开发者大会前夕,标志着 NotebookLM 从桌面端向移动端的重大扩展,为用户提供更便捷的跨平台研究体验。以下是 AIbase 整理的最新资讯,带您深入了解这一全新移动应用的亮点与功能。自2023年首次推出以来,NotebookLM 凭借其智能总结、语义搜索及音频概述(Audio Overviews)功能,成为学生、研究人员及职场人士的得力助手。然而,此前该工具仅限于桌面浏览器使用,