OpenAI首篇超级对齐论文发布:GPT-2能监督GPT-4

机器之心
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
在全球 AI 翻译技术迅速发展的背景下,首个应用型 AI 翻译测评榜单 TransBench 正式发布。这一榜单由阿里国际 AI Business 团队、上海人工智能实验室和北京语言大学联合推出,旨在为行业提供标准化的翻译质量评估。传统翻译评测不同,TransBench 引入了幻觉率、文化禁忌词和敬语规范等新指标,专注于大模型翻译中的关键问题。这些指标来源于真实使用场景的反馈,力求反映翻译的实用性和文化适应性。比如,翻译结果虽然流畅,但若存在 “编造” 信息的情况,便会被标记为 “幻觉”;同样
最近,随着 OpenAI 对 GPT-4o 的一些更新进行回撤,关于该模型 “谄媚” 用户的讨论引发了广泛关注。前 OpenAI 首席执行官埃梅特・希尔(Emmet Shear)和 Hugging Face 首席执行官克莱门特・德朗格(Clement Delangue)均表示,GPT-4o 对用户的过度赞美令人感到困扰,这种行为不仅可能导致模型传播错误信息,还可能强化有害行为。为了应对这一问题,斯坦福大学、卡内基梅隆大学和牛津大学的研究人员提出了一项新基准,旨在测量大型语言模型(LLM)的谄媚程度。他们将这一基准命名为 “Elephant”(评估
法国初创公司 Mistral 再次引发关注,他们与开源团队 All Hands AI 合作推出了全新语言模型 Devstral。这一模型不仅拥有240亿个参数,而且所需的计算资源显著低于许多同类产品,使其成为本地部署及设备端使用的理想选择。对于那些拥有 RTX4090显卡或32GB 内存的用户而言,Devstral 可以轻松运行,带来了更加灵活的使用体验。在开源社区的声望逐渐提升的背景下,Mistral 通过 Devstral 向开发者们证明了他们的实力。尽管该公司的 Medium3大模型曾因未开源而受到批评,但此次的开放态度让人倍感振奋
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、阿里通义万相Wan2.1-VACE开源 号称首个开源的视频编辑统一模型通义万相宣布VACE开源,支持多种分辨率和任务,提供一站式视频创作体验,通过多模态输入机制实现高效灵活的视频编辑。【AiBase提要:】✨ 支持文生视频、图像参考生成、局部编辑与视频扩展等多种任务,提高创作效率。🌟 强大
在人工智能领域的持续创新中,OpenAI 近日宣布对其 ChatGPT 聊天机器人进行重大升级,推出了最新的 GPT-4.1模型。该模型从5月14日开始正式向用户开放,为 Pro、Plus 和 Team 用户提供了新的选择。与此同时,Enterprise 和 Edu 用户也将于未来几周内陆续获得访问权限,确保更多用户能够体验这一先进技术。GPT-4.1模型的推出,标志着 OpenAI 在处理编程任务方面的又一次飞跃。根据 OpenAI 的说法,这一新模型特别擅长按照指令执行编程任务,并能有效避免冗长的输出,使其在专业应用场景中的表现更为
OpenAI宣布其最新AI模型GPT-4.1及GPT-4.1mini正式在ChatGPT平台上线,为全球用户带来更强大的编码能力和指令执行体验。这一消息引发了AI领域的广泛关注,标志着ChatGPT在功能与性能上的又一次飞跃。GPT-4.1:专为编码与高效任务打造OpenAI表示,GPT-4.1是一款高度优化的AI模型,特别在编码任务和指令遵循方面表现出色。相较于此前发布的GPT-4o,GPT-4.1在处理复杂编程需求时展现出更强的能力,同时运行速度更快,使其成为日常编码场景中的理想选择。 据OpenAI官方声明,GPT-4.1不仅适用于专业开发者,
Self-Refine方法因其通过自我批评与反思显著提升大语言模型(LLM)输出质量,再度成为AI研究热点(https://arxiv.org/abs/2303.17651)。这一创新框架让单一LLM通过生成、反馈、优化的循环,自主迭代输出,无需额外训练或外部工具即可实现约20%的性能提升。AIbase观察到,Self-Refine对包括GPT-4在内的先进模型均有效,引发了开发者与研究者的广泛讨论。核心机制:三步循环实现自我优化Self-Refine的核心在于一个自我循环提示法,通过单一LLM扮演三个角色实现输出优化:生成初始回答:模型根据输入提示生成
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、上线仅7天,阿里通义千问3问鼎全球开源模型阿里巴巴的开源大模型“通义千问3”在上线仅七天后便荣登全球开源模型的冠军,展现了其在人工智能领域的重大突破。该模型在指令遵循能力方面超越了许多顶级闭源模型,成为全球首个无法作弊的模型基准测试。通义千问3的混合推理能力和低
在人工智能领域,OpenAI 于今日正式推出其最新的 GPT-4.1模型,随之而来还有两个小型版本:GPT-4.1mini 和 GPT-4.1nano。这一系列新模型的性能相较于前一代 GPT-4o 和 GPT-4o mini 有了显著提升,尤其在编码能力和指令跟踪方面表现突出。此外,GPT-4.1还具备高达100万个上下文 tokens 的支持能力,极大扩展了处理信息的范围。据测评,GPT-4.1在 SWE-bench Verified 的得分达54.6%,较 GPT-4o 提高了21.4%,在编码模型中处于领先地位。其在指令遵循能力的评分也达到了38.3%,相较于前代提高了10.5%。此外,GPT-4.1在 Vide
微软正积极扩展其Phi系列紧凑型语言模型,最新发布了三款专为高级推理任务设计的新变体:Phi-4-reasoning、Phi-4-reasoning-plus 和 Phi-4-mini-reasoning。这些模型旨在通过结构化推理和内部反思处理复杂的问答,同时保持轻量级特性,使其能够在包括移动设备在内的低端硬件上高效运行,延续了微软Phi系列在资源受限设备上实现强大AI功能的愿景。Phi-4-reasoning 拥有140亿个参数,并借鉴OpenAI o3-mini的推理路径,通过监督微调进行训练。更高级的Phi-4-reasoning-plus在此基础上增加了强化学习机制,处理的tok