谷歌 DeepMind 的 Quoc V. Le 团队发现,随着模型规模的增加和指令调优,大模型更容易出现拍马屁的行为。他们提出使用合成数据进行干预,降低模型的拍马屁行为,并通过实验证明这种方法的有效性。