国产大模型超越GPT-3.5,天工大模型冲上OpenAI评测榜第一

量子位
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
在人工智能领域的持续创新中,OpenAI 近日宣布对其 ChatGPT 聊天机器人进行重大升级,推出了最新的 GPT-4.1模型。该模型从5月14日开始正式向用户开放,为 Pro、Plus 和 Team 用户提供了新的选择。与此同时,Enterprise 和 Edu 用户也将于未来几周内陆续获得访问权限,确保更多用户能够体验这一先进技术。GPT-4.1模型的推出,标志着 OpenAI 在处理编程任务方面的又一次飞跃。根据 OpenAI 的说法,这一新模型特别擅长按照指令执行编程任务,并能有效避免冗长的输出,使其在专业应用场景中的表现更为
OpenAI宣布其最新AI模型GPT-4.1及GPT-4.1mini正式在ChatGPT平台上线,为全球用户带来更强大的编码能力和指令执行体验。这一消息引发了AI领域的广泛关注,标志着ChatGPT在功能与性能上的又一次飞跃。GPT-4.1:专为编码与高效任务打造OpenAI表示,GPT-4.1是一款高度优化的AI模型,特别在编码任务和指令遵循方面表现出色。相较于此前发布的GPT-4o,GPT-4.1在处理复杂编程需求时展现出更强的能力,同时运行速度更快,使其成为日常编码场景中的理想选择。 据OpenAI官方声明,GPT-4.1不仅适用于专业开发者,
OpenAI首席执行官Sam Altman在最新访谈中分享了OpenAI的高速发布节奏、产品战略及未来愿景。他明确表示,OpenAI致力于打造操作系统级别的AI平台,通过小团队运作、算法创新和语音技术突破,引领AI行业迈向新高度。AIbase观察到,Altman对年轻一代使用ChatGPT的独特方式尤为关注,凸显了AI从工具向生活核心的转变趋势。图源备注:图片由AI生成,图片授权服务商Midjourney长远愿景:操作系统级AI平台Altman在访谈中阐述了OpenAI的终极目标:构建一个未来操作系统级别的AI平台,无缝嵌入用户生活,成为
备受瞩目的法律人工智能工具 Harvey 近日宣布战略调整,未来将整合 Anthropic 和谷歌的领先基础模型,结束了此前完全依赖 OpenAI 技术的局面。值得注意的是,Harvey 曾是 OpenAI 初创基金的明星投资项目之一,该基金旨在扶持基于 AI 技术(特别是 OpenAI 自研技术)的公司。尽管 Harvey 强调不会放弃 OpenAI,只是增加了更多模型和云服务选项,但此举无疑对 OpenAI 的竞争对手来说是一次重要的胜利。2022年12月,OpenAI 创业基金将 Harvey 列为其首批支持的四家初创公司之一,当时该基金由 OpenAI 首席执行
OpenAI 最近宣布将进行一项重要重组,以确保其非营利实体能够保留最终控制权。这一消息在上周引发了广泛关注,而日本科技巨头软银作为 OpenAI 的主要投资者之一,近日也公开表示支持这一计划。软银的认可显得尤为重要,因为他们此前曾表示,投资 OpenAI 的300亿美元必须以其结构调整为前提。回顾今年3月,OpenAI 成功完成了一轮400亿美元的融资,其中300亿美元来自软银。然而,软银曾警告,如果 OpenAI 在今年年底前没有完成重组,将可能将其投资额度削减至200亿美元。为了回应来自社会
根据知情人士透露,OpenAI 正在积极考虑在阿联酋建设一座新的数据中心,这一举措可能会显著增强其在中东地区的业务影响力。尽管目前该计划尚未最终敲定,依然有可能在未来几天内发生变化,但这一动向引发了业内的广泛关注。此次考虑建立数据中心的消息正值美国总统特朗普计划于本周四访问阿联酋之际。这一访问可能为 OpenAI 与阿联酋之间的合作提供了良好的契机。OpenAI 首席执行官萨姆・奥尔特曼目前也正在中东地区进行访问,参与这次科技领袖集体出访活动,显示出 OpenAI 对该
近日,OpenAI 发布了一款名为 HealthBench 的开源评估框架,旨在测量大型语言模型(LLMs)在真实医疗场景中的表现和安全性。此框架的开发得到了来自60个国家和26个医学专业的262名医生的支持,旨在弥补现有评估标准的不足,特别是在真实应用、专家验证和诊断覆盖方面。现有的医疗 AI 评估标准通常依赖于狭窄、结构化的形式,如多项选择考试。虽然这些形式在初步评估中有所帮助,但它们无法充分捕捉真实临床交互的复杂性和细微差别。HealthBench 则转向一种更具代表性的评估模式,包含
为进一步简化 AI 服务中的 Model Context Protocol(MCP)服务器集成流程,MCPHub 正式发布。作为一款可嵌入式解决方案,MCPHub 为开发者提供了统一的配置、管理与连接方式,兼容多种主流 AI 框架,包括 OpenAI Agents、LangChain 和 Autogen。在当前多模型、多框架并行演进的背景下,MCPHub 致力于打破服务集成复杂、部署门槛高的问题,通过统一接口与灵活配置,显著降低接入难度、提升效率。MCPHub 主要功能亮点包括:统一管理接口:提供命令行工具(CLI)与 API 接口,支持对 MCP 服务器的配置、安装和运行
在人工智能领域,OpenAI 与软银共同推出的星际之门(Stargate)项目一度引起了广泛关注。该项目计划投资高达1000亿美元,目标是建立全球领先的人工智能基础设施,并希望在未来将投资额提升至5000亿美元。然而,随着时间的推移,融资进展的缓慢和市场环境的变化使得这一宏伟计划面临挑战。 融资难题显现 根据最新消息,由于美国政府的关税政策,星际之门项目的融资进展出现了阻碍。针对服务器机架、芯片及冷却系统的关税措施,让潜在的投资者和金融机构对该项目的长期可行性产生
人工智能领域的领军企业OpenAI宣布,为其ChatGPT深度研究(Deep Research)工具新增了一项重要功能——一键将深度研究报告导出为PDF。此功能不仅提升了研究报告的实用性,还进一步推动了AI在企业场景中的落地应用。功能亮点:完整保留格式,专业输出OpenAI的深度研究工具能够通过多步骤网络搜索和信息整合,生成包含引用、表格和图片的详尽报告。然而,此前用户需手动整理或分享这些报告,限制了其在企业环境中的高效使用。新推出的PDF导出功能彻底解决了这一痛点。据OpenAI官方消息,