Meta推出雷朋智能眼镜的多模态AI功能测试:可识别物体并翻译语言

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
360公司旗下纳米AI超级搜索智能体迎来重大更新,新增多模态内容生成、跨领域专业搜索以及更智能的任务预览功能。从一键生成PPT、PDF报告到自动整合视频、口播稿和分镜规划,纳米AI以更高效、更直观的体验,重新定义了AI搜索与创作的边界。AIbase综合整理最新社交媒体动态,带您深入了解纳米AI的最新突破。多模态生成:从PPT到视频一键搞定纳米AI超级搜索智能体此次升级的最大亮点是多模态结果生成,支持生成PPT、PDF报告、网页和视频等多种格式。用户只需输入简单提示词,系统即可
MiniMax官方宣布,其AI助手产品MiniMax Agent已于https://agent.minimax.io正式上线,并迎来重大升级。新版本集成了多项前沿功能,旨在提升用户在创作、生产力与数据处理方面的体验,为个人和企业用户提供更智能的AI协作体验。新升级的MiniMax Agent在图像处理方面表现突出,引入更智能的图像搜索功能和更稳定的图像生成技术,用户可轻松生成高质量视觉内容。同时,新增的**反射模式**极大提升了长期任务处理能力,使AI能够更高效地应对复杂、多步骤的工作流程,适合学术研究、市场分析等场
高通公司正式发布了其全新的骁龙 AR1+ Gen 处理器,旨在为智能眼镜提供更强大的支持。与之前的骁龙 AR1Gen1芯片相比,新款处理器虽然在性能上仅有小幅提升,但最大的亮点在于它实现了设备端人工智能的直接支持。这意味着用户只需佩戴智能眼镜,便可以享受到便捷的 AI 服务,而不必依赖于智能手机或云端。骁龙 AR1+ Gen1的体积更小,面积减少了28%,这使得眼镜的支架高度可以降低20%。在功耗方面,这款新处理器在关键应用中如计算机视觉、语音唤醒、蓝牙播放和视频流等领域,能够将
国内知名黄金珠宝企业老凤祥正式宣布进军AI科技领域,旗下老凤祥眼镜品牌推出首款AI智能眼镜产品。这款专为中老年群体设计的智能眼镜将于6月11日至13日在上海老博会上正式亮相,标志着传统珠宝企业向科技领域的重要跨界尝试。与市场上大多数面向年轻消费者的智能眼镜不同,老凤祥AI眼镜精准聚焦于中老年群体这一细分市场。该产品搭载豆包大模型,集成了多项贴合中老年用户需求的实用功能。用户可以通过眼镜轻松拍照记录生活美好瞬间,利用AI识物功能快速获取周围物品的详细
随着智能眼镜领域竞争日益激烈,Snapchat制造商Snap公司周二宣布计划在2026年推出第六代增强现实眼镜。这款新产品将正式告别沿用多年的Spectacles品牌,改名为"Specs",标志着该公司在可穿戴设备战略上的重要转折。技术升级与产品定位新一代Specs眼镜将采用增强现实技术,让用户能够看到覆盖在物理世界上的数字图像并与之互动。虽然Snap没有透露具体价格和确切发布日期,但公司承诺新眼镜将比前代产品更小、更轻。作为对比,Snap最新的Spectacles于2024年9月面向开发者发布,采用租赁模式,
据科技日报报道,中国科学院自动化研究所的科研人员近期取得了重要突破。他们首次证实,多模态大语言模型在训练过程中能够自发 “理解” 事物,其理解方式与人类的认知非常相似。这一发现不仅为我们探索人工智能的思维机制开辟了新路径,还为未来开发能够像人类一样理解世界的人工智能系统奠定了基础。这项研究成果已在《自然・机器智能》杂志上发表。理解是人类智能的核心。当我们看到 “狗” 或 “苹果” 时,除了能够识别其外观特征,如大小、颜色和形状,我们还理解
近年来人工智能领域发生了翻天覆地的变化,尤其是大型语言模型(LLMs)在多模态任务上取得了显著进展。这些模型在理解和生成语言的能力上展现出了强大的潜力,但目前大多数多模态模型依然采用自回归(AR)架构,推理过程较为单一、缺乏灵活性。为此,香港大学和华为诺亚方舟实验室的研究团队提出了一种全新的模型 ——FUDOKI,旨在打破这一局限。FUDOKI 的核心创新在于其全新的非掩码离散流匹配(Discrete Flow Matching)架构。与传统的自回归模型不同,FUDOKI 通过并行去噪机制,能够实
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、美团王兴详解AI布局:No Code平台免费开放,1680个应用已上线美团创始人王兴在北京美团总部恒电大厦的股东大会上首次系统阐述了公司的AI战略布局,包括早期在外卖配送中的应用,当前阶段的大语言模型开发,以及No Code平台的推出。尽管面临巨大的资金和技术挑战,美团依然坚持长期投入
苹果公司今日正式推出了全新的 Xcode26开发者工具,这是为 iOS26、iPadOS26、macOS Tahoe26、watchOS26和 tvOS26应用开发而设计的。此次发布的 Xcode26内置了像 ChatGPT 这样的先进 AI 功能,为开发者带来了更加智能和高效的编码体验。根据苹果的介绍,Xcode26将大型语言模型与开发环境无缝集成,允许开发者在编写代码、进行测试以及撰写文档时获得 AI 的帮助。开发者不仅可以直接在 Xcode 中使用 ChatGPT,还可以通过 API 密钥连接其他提供商的 AI 服务,甚至可以在 Apple Silicon 上本地运行模型。这种灵活的
OpenAI 在去年推出的 GPT-4o 基础上,再次对其高级语音模式进行了重大的更新,使得语音交流变得更加自然和贴近人类的对话方式。这一先进的功能依托于原生的多模态模型,能够快速响应音频输入,最快在232毫秒内作出反应,平均响应时间为320毫秒,几乎与人类的对话速度不相上下。在今年年初,OpenAI 已经对这一语音模式进行了小幅更新,改善了打断频率和口音处理。而此次的重大升级,更是使语音回复的语调变得更加细腻、节奏更加自然,尤其是在停顿和强调的处理上,显得更加生动。