谷歌最近发布了开源大模型Gemma,在开源界引起轰动。然而,在国内开源大模型领域,InternLM2居于榜首,表现优异,完胜了Gemma和Llama。开源大模型领域的竞争日趋激烈,各大科技厂商纷纷推出自家产品,大模型战场变得愈发热闹。
谷歌最近发布了开源大模型Gemma,在开源界引起轰动。然而,在国内开源大模型领域,InternLM2居于榜首,表现优异,完胜了Gemma和Llama。开源大模型领域的竞争日趋激烈,各大科技厂商纷纷推出自家产品,大模型战场变得愈发热闹。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

谷歌推出A2UI新标准,让AI能直接生成图形界面元素,如按钮和表单,提升交互体验。传统AI交互依赖文本,处理复杂任务繁琐。A2UI开源项目规范AI生成视觉响应,使客服等场景能即时创建界面,简化操作流程。

苹果与普渡大学合作推出DarkDiff技术,通过将生成式扩散模型融入相机图像处理流程,显著提升智能手机在极暗环境下的拍照效果。该技术直接处理原始图像数据,有效解决传统夜景模式降噪导致的细节模糊和虚假感问题,实现在黑暗中捕捉清晰细节。

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://app.aibase.com/zh1、阿里通义千问Qwen发布分层图像编辑模型Qwen-Image-Layered,一键生成“Photoshop图层”阿里通义千问Qwen发布了分层图像编辑模型Qwen-Image-Layered,该模型能够将静态照片分解为多个具有透明背景的独立RGBA图层,使AI图像编辑具备类似Photoshop的结构化操作能力。文章介绍了PromptFill这一开源结构化提示词生成工具,通过填空式交互降低AI绘画的门槛,解决复杂Prompt编写难题,并强调其在提升创作效率和隐私保护方面的优势。

通义千问发布图像生成模型Qwen-Image-Layered,创新采用“图层拆解”技术,实现静态图片的精准编辑。该模型通过“图像解耦”思路,将图片自动分层,有效解决传统AI编辑中全局修改破坏一致性和局部编辑处理遮挡模糊边界的两大痛点,开启“指哪改哪”的新时代。

北京人形机器人创新中心开源国内首个符合具身智能国家标准的VLA大模型XR-1,并配套发布RoboMIND2.0数据底座和ArtVIP高保真数字资产数据集,旨在推动机器人技术发展,为开发者提供强大支持。

谷歌正将Chrome浏览器升级为智能效率工具。最新测试版中,新标签页搜索框新增全功能“+”菜单,支持图片上传,成为集成操作中心,提升浏览体验。

千问App发布2025年十大AI提示词榜单,"股票"位居榜首,热度远超其他类别。这反映出大众对资本市场的关注以及AI在投资决策中的快速渗透,AI正演变为"理财顾问"。该现象与2025年A股市场强劲表现相关,上证指数一度突破4000点。

阿里千问发布2025年十大AI提示词榜单,通过用户高频交互场景,揭示当代社会心态。其中“股票”位居榜首,显示AI已成为股民分析市场与心理建设的重要工具;“八字”与“情感咨询”紧随其后,反映出从赛博算命到深夜谈心,AI正深度介入人们的精神生活。
AI持续执行能力成新焦点,Claude Opus4.5在超长任务处理上创纪录,成功率50%下可持续工作近5小时,刷新行业标准。

谷歌推出A2UI开放标准,让AI代理能即时生成图形界面元素,如表单和按钮,无缝融入应用,实现从纯文本到动态界面的交互变革。该标准采用Apache 2.0许可证,旨在规范AI创建视觉响应的方式,弥合生成式AI与图形用户界面之间的鸿沟。