ARC-AGI 基准即将突破,但创始人警告测试设计存在缺陷
人工智能领域的一个重要基准,ARC-AGI,即“通用人工智能抽象和推理语料库”,即将取得突破性进展。然而,测试的创始人弗朗索瓦·肖莱(Francois Chollet)警告,尽管成绩提高,但这并不意味着我们接近实现通用人工智能(AGI)。他指出,这项测试本身存在设计缺陷,且其所能揭示的并非真正的研究突破。自2019年肖莱推出ARC-AGI以来,AI系统在测试中始终表现不佳,迄今为止,表现最好的系统仅能解决不到三分之一的任务。肖莱表示,这主要归咎于目前人工智能研究过于依赖大型语言模型(L