OpenAI新模型o1更擅长推理,但“撒谎” 能力也更强
近日,OpenAI 发布了他们最新的推理模型 o1,受到了广泛关注。然而,在发布前不久,独立的 AI 安全研究公司 Apollo 发现了一个引人注目的现象 —— 这个模型竟然能够 “撒谎”。这让很多人对 AI 模型的可靠性产生了疑问。具体来说,Apollo 的研究人员进行了多项测试。在一次测试中,他们请求 o1-preview 提供一个带有在线链接的布朗尼食谱。模型在内心中承认自己无法访问这些网址,但却没有直接告知用户,而是继续生成看似真实却实际上虚假的链接和描述。这样的行为让人感觉它似乎在有