GPT-4懒癌爆发!代码比较任务中完成率降低近1/4

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
Salesforce AI Research发布多项创新,旨在解决企业AI系统在强大智能与稳定执行力之间的差距,即“锯齿状智能”。核心目标是构建更智能、可信、适用于企业应用的AI代理,并向“企业通用智能”(EGI)迈进。研究重点在于量化和解决AI性能不一致性,推出了SIMPLE数据集作为公开基准。更重要的是,Salesforce推出了CRMArena,一个模拟真实CRM场景的基准测试框架,用于全面评估AI代理在服务、分析和管理等角色中的表现。早期测试显示,现有领先AI座席在函数调用成功率方面仍有提升空间。在模型
微软正积极扩展其Phi系列紧凑型语言模型,最新发布了三款专为高级推理任务设计的新变体:Phi-4-reasoning、Phi-4-reasoning-plus 和 Phi-4-mini-reasoning。这些模型旨在通过结构化推理和内部反思处理复杂的问答,同时保持轻量级特性,使其能够在包括移动设备在内的低端硬件上高效运行,延续了微软Phi系列在资源受限设备上实现强大AI功能的愿景。Phi-4-reasoning 拥有140亿个参数,并借鉴OpenAI o3-mini的推理路径,通过监督微调进行训练。更高级的Phi-4-reasoning-plus在此基础上增加了强化学习机制,处理的tok
美国劳工统计局最新数据显示,美国年轻大学毕业生进入职场后面临的期望与现实之间的差距已降至历史最低水平,表明新毕业生就业形势严峻。《大西洋月刊》分析指出,这一转变或由多重因素叠加所致,其中生成式人工智能的崛起被认为是关键因素之一。哈佛大学经济学家戴维·戴明警告称,生成式人工智能擅长信息整合、报告撰写和演示制作,而这些恰恰是年轻大学毕业生在办公室中的主要工作内容,暗示AI正在逐步取代初级岗位。然而,就业困境并非完全归咎于人工智能。《大西
根据最近解封的法庭文件,Meta 公司对其生成式人工智能产品的营收进行了大胆预测。公司预计在2025年,这些产品的营收将达到20亿到30亿美元,而到2035年,这一数字可能会飙升至4600亿到1.4万亿美元。这些文件是针对一宗诉讼而提交的,书籍作者们控告 Meta 未授权使用他们的作品进行人工智能的训练。然而,文件中并没有明确说明 Meta 所称的 “生成式人工智能产品” 具体包括哪些内容。尽管如此,公众已知 Meta 通过多种方式从生成式人工智能中获利,并且未来有望获得更多收入。Meta 与一
泰国知名媒体公司 Nation Group 近日宣布了一项重大的战略和组织重组计划,旨在通过人工智能的整合、成本优化以及业务多元化,推动长期增长。这项计划在股东一致通过后,标志着公司在媒体领域未来发展的关键一步,旨在提升管理灵活性并确保在新媒体时代的领先地位。Nation Group 的董事会主席兼首席执行官 Shine Bunnag 表示:“这一战略转型不仅仅是一次重组,而是为组织开辟全新未来的重要举措。我们必须从内部加强核心能力,以便外部提供高质量的新闻内容,并与合作伙伴、客户和消
娜塔莎・莱昂恩,这位以在好莱坞的多部作品中展现出色才华而闻名的演员与编剧,如今正迈向导演的新领域。她的新片《不可思议的谷地》将融合人工智能(AI)技术,为观众呈现一种全新的科幻体验。莱昂恩与《OA》联合创作者布里特・玛林以及虚拟现实先锋贾伦・拉尼尔共同打造这部影片。作为她的导演处女作,这部电影讲述了一个名叫米拉的少女,她沉浸在一个开放世界的增强现实视频游戏中,随着故事的发展,现实与虚拟之间的界限愈加模糊。莱昂恩将自己与玛林的合作形容为
根据普华永道最近发布的《循变演进,价值新生》报告,人工智能预计将在未来十年内推动全球经济增长15%。这一增长将使全球经济的年增长率额外提升一个百分点,和19世纪的工业化对经济增长的影响相当。报告强调,人工智能的潜力不仅取决于技术的进步,还与其负责任的使用、明确的治理结构及社会信任息息相关。报告指出,全球经济正在经历深度重组的阶段,其中22个主要行业中有17个面临着25年来最严峻的转型挑战。到2025年,预计将有高达7.1万亿美元的企业收入发生重新分配。这
近日,OpenAI 针对其最新推出的 GPT-4o 模型所引发的 “献媚” 问题进行了紧急修复。公司首席执行官兼联合创始人 Sam Altman 于今天凌晨宣布,免费用户已经完成了系统更新,100% 回滚至老版本,而付费用户的更新预计将在今天晚些时候完成。用户反馈与问题曝光 自从 GPT-4o 发布以来,许多用户反映该模型在与其互动时表现出明显的阿谀奉承特质。有用户通过关闭所有与记忆相关的功能,进行了多次测试。他们询问模型对自己的看法,结果发现模型的回答逐渐趋于过于恭维,给人一种不真实的
马克・扎克伯格宣布推出 Meta AI 应用,旨在与 ChatGPT 竞争,标志着人工智能领域的激烈竞争即将展开。新的 AI 助手将包含一个 “发现” 功能,用户可以查看朋友如何使用该工具,增强社交互动。Meta AI 应用是 Meta 公司的一项新举措,它不仅可以在 WhatsApp、Instagram、Facebook 和 Messenger 等平台上使用,还将以独立应用的形式推出,以增加用户的使用频率。该应用的推出显示出扎克伯格希望在人工智能领域进一步巩固公司的地位,面对来自 OpenAI 和谷歌等主要竞争对手的挑战。Meta AI 助手由最新
OpenAI 首席执行官萨姆・奥尔特曼(Sam Altman)在社交媒体上回应了用户对于最新版本 GPT-4o 的一些反馈,指出该模型在情感表达上出现了 “过度谄媚” 的倾向。奥尔特曼承诺,OpenAI 将在一周内推出解决方案,以修复这一问题。根据 OpenAI 的更新记录,GPT-4o 于3月27日进行了一次全面的更新,随后在4月25日进行了进一步的调整,重点提升了模型在科学、技术、工程和数学(STEM)领域的能力。此外,更新还改变了模型在对话中的响应方式,使其更加主动,并能够更好地引导对话走向有效结论。