逻辑推理大翻车!GPT-4、Gemini被曝重大缺陷,LLM严重降智

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
近日,谷歌正式发布了一款专为iPadOS设计的全新应用 ——Gemini。这款应用的推出旨在提升用户在多任务处理和创作方面的效率,充分利用了 iPad 的大屏幕优势。Gemini 支持分屏功能,让用户能够在同一界面上同时进行多个任务,极大地方便了用户的日常使用。Gemini 应用的功能十分强大,涵盖了多语言对话、快速报告生成、音频概述扩展以及图像和视频创作等多项实用功能。例如,用户可以通过多语言对话功能与全球用户无障碍沟通,而快速报告生成则能帮助用户迅速整理信息,节省宝贵时
Google于近日宣布,旗下Gemini2.0Flash图像生成功能迎来重要升级,用户现可通过Google AI Studio体验最新模型:gemini-2.0-flash-preview-image-generation。据介绍,本次升级带来三大核心改进:更高的视觉质量,相较于早期实验版本整体图像表现更自然、细节更丰富;文字渲染更精准,解决了AI生成图像中文字扭曲、不清晰等问题;内容安全机制优化,减少了不必要的生成内容拦截,提高生成效率与可用性。此次更新体现了Google持续推动Gemini模型在多模态生成能力上的突破,也为AI创作者提供了更实用、更精确的
谷歌正式推出了专为 iPadOS 系统设计的 Gemini 应用。此前,用户只能通过兼容模式在 iPad 上使用 iOS 版本的 Gemini,使用体验相对有限。而新的 iPad 专属应用将大大提升用户的使用体验。在新应用中,用户可以利用 iPad 的分屏功能,将 Gemini 与其他应用并排使用,实现更高效的多任务处理。此外,Gemini 应用还集成了一系列强大的功能,提升用户的工作效率。首先,Gemini Live 功能支持用户以自然的方式进行自由流畅的对话,支持超过45种语言。这对于需要进行跨语言交流的用户而言,极大地方便
近日,三星宣布将在其最新的 One UI Watch8系统中集成谷歌的 Gemini AI 助手,这一功能的引入将为用户带来更为流畅和高效的操作体验。根据科技媒体 Android Authority 的报道,通过对 One UI Watch8的 APK 文件进行逆向编译,发现 Gemini AI 将不仅仅是取代原有的 Google Assistant,还将提供一系列增强的 AI 功能,尤其是在健康和健身领域,期待能为用户提供更多帮助。Gemini AI 的核心新特性是 “Gemini Actions” 功能。该功能使得用户能够跨不同应用进行操作,意味着你不再需要频繁切换设备或应用程序。只需
近日,小红书正式推出了名为 NoteLLM 的多模态大型语言模型框架,旨在为用户提供更精准的笔记推荐服务。这个框架不仅能够理解文本信息,还能有效处理图像,借助其强大的语义理解能力,大幅提升了笔记推荐的准确性与相关性。NoteLLM 的核心技术在于生成笔记的压缩嵌入与自动生成标签的能力。通过引入对比学习与指令微调技术,该框架可以更好地解析用户行为数据,从而为每个笔记生成合适的标签和类别。这一创新的功能不仅优化了用户在平台上的使用体验,也极大地增强了用户与
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、上线仅7天,阿里通义千问3问鼎全球开源模型阿里巴巴的开源大模型“通义千问3”在上线仅七天后便荣登全球开源模型的冠军,展现了其在人工智能领域的重大突破。该模型在指令遵循能力方面超越了许多顶级闭源模型,成为全球首个无法作弊的模型基准测试。通义千问3的混合推理能力和低
在人工智能领域,OpenAI 于今日正式推出其最新的 GPT-4.1模型,随之而来还有两个小型版本:GPT-4.1mini 和 GPT-4.1nano。这一系列新模型的性能相较于前一代 GPT-4o 和 GPT-4o mini 有了显著提升,尤其在编码能力和指令跟踪方面表现突出。此外,GPT-4.1还具备高达100万个上下文 tokens 的支持能力,极大扩展了处理信息的范围。据测评,GPT-4.1在 SWE-bench Verified 的得分达54.6%,较 GPT-4o 提高了21.4%,在编码模型中处于领先地位。其在指令遵循能力的评分也达到了38.3%,相较于前代提高了10.5%。此外,GPT-4.1在 Vide
近日,Google 宣布推出其最新的 AI 模型 ——Gemini2.5Pro Preview(I/O 版)。这一升级版是在即将召开的 Google I/O2025开发者大会前发布的,标志着公司在 AI 领域的持续创新。根据 Google 的说法,Gemini2.5Pro Preview 在多项广泛使用的基准测试中表现优异,力求在激烈的市场竞争中占据一席之地。Gemini2.5Pro Preview 可以通过 Gemini API 以及 Google 的 Vertex AI 和 AI Studio 平台获取,价格与之前的 Gemini2.5Pro 模型相同。此外,它也将融入 Google 的 Gemini 聊天机器人应用中,适用于网页和移动设备。此次发布的时机恰
在数字手表界,三星的 One UI Watch8正在悄然崭露头角。根据最近泄露的信息,三星对这一新系统进行了全面的音效升级,并引入了众多令人期待的变化。通过网络上的音频文件,我们得以一窥 One UI Watch8的音效细节,这些音效不仅涵盖了相机快门声、充电提示音和低电量提醒音等常见声音,还包括了三星最新版本的经典旋律 “Over the Horizon”。不仅如此,One UI Watch8还将更新其应用图标。这些新图标在设计上与之前的 One UI7相似,为用户提供了一个既熟悉又全新的视觉体验。三星此次选择直接
近日,谷歌的 Gemini 聊天机器人迎来了重要更新,新增了多图上传功能,这一功能目前已经向部分用户开放。以往,用户只能上传单张图片,但现在在 Gemini2.0Flash 模型的支持下,部分用户已经能够在网页端同时上传多张图片。值得注意的是,该功能尚不支持免费账户,且在某些付费高级账户中也没有完全开放。这种分阶段推出的策略可能是为了逐步评估用户的反馈。除了多图上传,谷歌还在更新中加入了 AI 图像编辑功能,用户现在可以对 AI 生成的图像以及自己上传的图片进行更改。用户