Meta公司近日宣布,其Ray-Ban智能眼镜将推出三项全新功能:实时AI、实时翻译和Shazam。其中,实时AI和实时翻译功能目前仅限于Meta早期访问计划的成员使用,而Shazam功能则面向美国和加拿大的所有用户开放。
Meta智能眼镜迎来AI升级:实时AI、翻译和Shazam功能上线

AIbase基地
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
Meta公司近日宣布,其Ray-Ban智能眼镜将推出三项全新功能:实时AI、实时翻译和Shazam。其中,实时AI和实时翻译功能目前仅限于Meta早期访问计划的成员使用,而Shazam功能则面向美国和加拿大的所有用户开放。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
Google I/O大会上,Google正式推出了其革命性的3D视频通信平台——Google Beam。这一平台以人工智能为核心,将传统的2D视频通话升级为身临其境的3D体验,旨在让远程沟通如同面对面般真实自然。AIbase为您带来这一前沿科技的最新资讯,解析其技术亮点与未来潜力。从 Project Starline 到 Google Beam:技术进化的里程碑Google Beam脱胎于2021年首次亮相的Project Starline研究项目。过去几年,Google不断优化其3D视频通信技术,如今以更成熟的形态推出Google Beam。相较于传统视频会议系统,Google Beam通过先进的硬
Meta公司近日宣布,其Ray-Ban Meta智能眼镜的实时翻译功能已正式向全球用户开放。此前,这一功能仅限于部分市场的早期测试用户。此次全面推出意味着用户可以在多种场景下,享受到更加便捷的语言转换体验,尤其是能够在无网络的环境下,突破语言障碍。根据Meta的官方消息,Ray-Ban Meta智能眼镜的实时翻译功能现已覆盖全球销售市场,支持英语、法语、意大利语和西班牙语四种语言的实时双向翻译。用户只需通过简单的语音指令“Hey Meta, start live translation”便可启动翻译功能,轻松实现
近日,Meta 公司宣布,为其 Ray-Ban 智能眼镜推出多种新功能,包括实时翻译、Instagram 消息和通话功能等。这些功能原本仅限于 Meta 的抢先体验计划用户,现在已全面向所有 Ray-Ban 智能眼镜用户开放。实时翻译功能最早在2024年 Meta Connect 大会上首次披露,并于去年12月在部分国家进行有限测试。现在,用户可以在支持的市场中,使用该功能与讲英语、法语、意大利语或西班牙语的人进行交流,并通过眼镜获得实时翻译,方便与不同语言的人进行沟通。此外,如果用户提前下载语言包,即使在
游戏开发工作室正在迎来一项新技术,有望彻底改变多人游戏中的交流环境。VoicePatrol最近推出了实时AI语音保护技术,旨在打造更安全的游戏社区,同时避免传统审核方法带来的过度干预问题。总部位于加利福尼亚州门洛帕克的VoicePatrol于2023年成立,经过一年的技术研发,在2024年第二季度推出了首款产品。该公司由首席执行官兼机器学习工程师Matei Trebien领导,目前拥有8名员工,已筹集数百万美元资金,但尚未披露具体金额。独特的保护理念VoicePatrol的创始人刻意避开传统的"审核"策略,
近日,谷歌人工智能开发平台Google AI Studio迎来了一次重大更新,全新的“Gemini-2.0-flash-live-001”模型正式亮相,并即刻取代了此前处于实验阶段的Gemini2.0Flash Experimental版本。这一消息迅速在全球开发者社区引发热议。据悉,这一新模型作为Gemini系列Live API的公开预览版本,已正式启用计费功能,标志着谷歌在实时AI交互技术上的又一次飞跃。Gemini-2.0-flash-live-001被设计为一个高效的多模态模型,旨在为开发者提供低延迟、高性能的实时应用开发能力。与之前的实验版本相比,新模型在速度、稳
随着人工智能(AI)技术的迅速发展,如何在大规模环境下有效应用这些技术成为了一大挑战。近日,Arthur正式推出了Arthur Engine,这是一款首个开源的实时 AI 评估引擎,旨在帮助团队监控、调试和改进生成式 AI 及传统机器学习(ML)模型。其最大的特点是无需依赖第三方工具,确保数据隐私安全,同时也完全免费。在2025年,实时 AI 评估的重要性愈加凸显。随着 AI 技术的广泛应用,相关风险也在不断增加。例如,调查显示,8.5% 的员工提示中包含敏感数据,模型在没有持续监控的情况下会发
谷歌最近宣布其 Gemini Live 已开始推出新功能,这些功能使其能够通过智能手机摄像头实时回答用户的问题,并 “看到” 用户的屏幕。这些新功能是在谷歌的 “Project Astra” 项目支持下,经过近一年的研发后首次面世。根据谷歌发言人 Alex Joseph 的介绍,Gemini Live 的更新意味着用户在使用手机时可以通过该助手获得更加智能和直观的支持。有用户在 Reddit 上分享了他们在小米手机上体验该功能的情况,9to5Google 也对此进行了报道。近日,该用户还发布了演示视频,展示了 Gemini 的新屏幕阅读功
近日,由xAI打造的人工智能助手Grok正式推出全新功能DeeperSearch,标志着其在信息检索领域的又一次突破。据悉,DeeperSearch能够深入搜索并分析过去48小时内Twitter上的热点AI资讯,为用户提供及时、准确的动态信息,受到初步测试用户的一致好评。Grok作为xAI的核心产品,一直致力于通过强大的人工智能技术帮助用户解答问题、探索知识。新上线的DeeperSearch功能显著增强了其实时数据处理能力,尤其在Twitter这一信息流速极高的平台上表现突出。用户反馈,该功能能够快速抓取AI领域的最新趋势
YouTube Dubbing 是一款强大的浏览器插件,它具有 AI 实时翻译与配音功能,只需一键点击插件按钮,就能让用户用熟悉的语言进行视频播放,轻松畅享外文视频,告别繁琐字幕。YouTube Dubbing 简介:YouTube Dubbing 是一款专门针对外语视频观看的语言辅助插件。它通过 AI 实时翻译与配音技术,将外语视频秒变中文解说,并同步显示字幕,帮助用户跨越语言障碍,提升学习和娱乐体验。它支持多种语言和主流视频平台,适合不同语言背景的用户。其主要优点包括精准的语音翻译、多语言支持、多平
在2025年消费电子展(CES)上,三星宣布将一项流行的手机和平板电脑功能引入其电视产品 —— 实时翻译(Live Translate)。这一功能旨在为用户提供实时的直播翻译服务,使得不同语言的观众能够更轻松地享受节目。实时翻译功能支持七种语言,虽然截至目前尚未明确具体是哪七种语言。这项技术的运作原理是通过翻译节目中的字幕,而不是直接对音频进行翻译。自2024年初在 Galaxy S24手机上首次推出以来,实时翻译功能在移动设备上已经支持13种语言,而电视版本则选择在更为基础的七种语言