Google与约翰霍普金斯大学研究人员发布更快、更高效的文本到图像生成蒸馏方法

MarkTechPost
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
近日,斯坦福大学发布了一项有关临床医疗 AI 模型的全面评测,DeepSeek R1以66% 的胜率和0.75的宏观平均分,在九个前沿大模型中脱颖而出,成为冠军。这一评测的亮点在于,它不仅关注传统医疗执照考试题,更深入到临床医生的日常工作场景,给出了更切实的评估。评测团队构建了一个名为 MedHELM 的综合评估框架,包含35个基准测试,覆盖22个医疗任务子类别。这个框架的设计经过了29名来自14个医学专科的执业医生验证,确保了其合理性与实用性。最终,评测结果揭示了 DeepSeek R1的优越性能
近日, DeepSeek 发布了其最新的 R1推理 AI 模型更新版,该模型在多个数学和编程基准测试中展现出色性能。然而,DeepSeek 并未透露其模型的训练数据来源,令一些 AI 研究人员产生了疑问,并推测该模型可能部分基于 Google 的 Gemini AI 系列进行训练。墨尔本的开发者 Sam Paeach 声称,他发现 DeepSeek 的 R1-0528模型在用词和表达方式上与 Google Gemini2.5Pro 有许多相似之处。虽然这并不能作为直接证据,但另一位开发者 —— 匿名的 SpeechMap 项目创始人 —— 也提到,DeepSeek 模型在推理过程中产生的 “思
谷歌低调推出了一款名为Google AI Edge Gallery的实验性应用,标志着边缘计算和隐私优先的AI部署迈出了重要一步。这款应用允许用户在智能手机上直接运行来自Hugging Face平台的开源AI模型,无需网络连接即可实现图像生成、文本处理、代码编辑等多项功能。本地化AI的里程碑Google AI Edge Gallery通过谷歌的LiteRT(轻量运行时)技术,利用设备本地硬件运行AI模型,显著提升了数据隐私性和处理速度。应用支持多种任务,包括“AI Chat”用于对话、“Ask Image”用于图像分析,以及“Prompt Lab”用于文本
根据最新消息,谷歌已经暂停了其在 Google Photos 中推出的 AI 驱动 “Ask Photos” 功能。该功能自去年秋季以来逐步扩展,但目前并未达到预期的效果。谷歌 Photos 的产品经理 Jamie Aspinall 在社交平台 X 上表示:“询问照片功能还未达到我们希望的水平。” 他指出,当前的主要问题包括延迟、质量和用户体验等三个方面。“Ask Photos” 功能使用的是谷歌最新的 Gemini AI 模型,特别是为该功能定制的版本。Aspinal 提到,由于这些问题的存在,谷歌决定在小范围内暂停该功能的推广,并计划在两周内推
在近期举办的Google I/O2025大会上,谷歌宣布了其全新AI驱动项目——“试穿”(Try On)实验,并于近日在美国向更多用户开放。这一功能利用生成式AI技术,让用户通过上传照片即可虚拟试穿服装,显著提升在线购物的便捷性和真实感。AIbase综合最新网络信息,为您深入解析这一创新实验的亮点及其对电商行业的潜在影响。虚拟试衣新体验:AI让购物更直观谷歌“试穿”实验基于其最新的图像生成模型,专为时尚场景设计,能够精准模拟服装在用户身上的真实效果。用户只需在Google Shopping平台
在近期举办的Google I/O2025大会上,Google悄然推出了一款开源项目——Google AI Edge Gallery,一款完全本地运行的生成式AI应用,基于最新的Gemma3n模型,集成了多模态能力,支持文本、图片和音频输入。这一项目以其高效的端侧AI性能和开源特性,为开发者提供了构建本地化AI应用的理想模板。Google AI Edge Gallery:端侧AI的开源新标杆Google AI Edge Gallery是一款面向Android(iOS版本即将推出)的实验性应用,允许用户在本地设备上运行来自Hugging Face的多种开源AI模型,无需联网即可实现高效推理。项目采用
根据《商业内幕》的报道,OpenAI 近期与前 iPhone 设计师乔纳森・艾维(Jonathan Ive)达成了近65亿美元的收购交易,开启了一场备受瞩目的科技合作。对此,Google 首席执行官桑达尔・皮查伊(Sundar Pichai)也发表了看法,加入了讨论的行列。在科技行业,AI 技术的迅猛发展让各大巨头纷纷寻找顶尖人才,以便于在这个领域占据领先地位。OpenAI 此次收购了艾维所创立的硬件公司 io,计划与艾维的设计公司 LoveFrom 合作,开发出创新的 AI 硬件。面对这一新动向,皮查伊对艾维给予了高度赞扬。他在接
近日,马斯克在其社交账号上发出这一断言,并 @ 了自家 xAI 旗下的聊天机器人 Grok,引发行业热议。他引用的,是一份显示 Google 搜索市场份额十年来首次跌破90% 的报告。据该报告显示,Google 的全球搜索引擎份额已降至89.71%,为2015年以来的最低点。报告指出,用户正逐渐对充斥 SEO 优化和广告干扰的传统搜索体验感到疲惫,AI 驱动的搜索正在迅速蚕食其市场份额。马斯克的这番表态不仅是对 Google 的正面挑战,也暗示了他对自家 Grok 系统在搜索场景中替代性能力的信心。这也是 xAI 加快布
位于旧金山的人工智能初创公司Anthropic宣布推出 Claude 人工智能聊天机器人新的重大更新:全新的语音对话模式。该功能已在苹果 App Store(iOS 设备)和谷歌 Play Store(Android 设备)的移动应用中上线。除了语音模式的推出,Anthropic还为所有免费用户扩展了网络搜索功能。这些更新旨在提升 Claude 的多样性和可及性,使其服务更多用户。Anthropic的 Claude 关系负责人亚历克斯・阿尔伯特在社交媒体上表示,这一早期的语音实现已经让他感到非常有趣和实用,希望用户们能分享他们的反馈,以便未来进
Google 近日发布了 Chrome v137开发者工具(Chrome DevTools)的重大更新,集成了 Gemini AI 智能助手,为开发者带来前所未有的性能分析和调试体验。从智能标注性能追踪到 CSS 修改保存,Chrome v137的新功能极大提升了开发效率。AIbase 综合整理最新信息,为您详细解析此次更新的亮点与应用前景。Gemini 智能标注:性能分析更直观Chrome v137DevTools 引入了 Gemini 智能标注功能,开发者可通过双击性能追踪中的主轨道(Main Track)事件,点击“生成标签”按钮,让 Gemini 根据堆栈跟踪和上下文自动生成事件标