人工智能对齐问题日益复杂,OpenAI的研究指出通过小模型监督大模型,可在自然语言处理任务中显著提高泛化性能。传统人类监督在超级AI模型上或许不够,但弱到强泛化方法有望显著提高性能。该研究鼓励更多实证性研究,提供开源代码并启动资助计划。未来或将迎来超级AI对齐领域的实质性进展。