电脑游戏《Factorio》成为 AI 能力评估的新工具
《Factorio》是一款复杂的电脑游戏,专注于建造与资源管理,最近成为研究人员评估人工智能能力的新工具。这款游戏能够测试语言模型在规划和构建复杂系统的能力,同时管理多个资源和生产链。为此,研究团队开发了一个名 “Factorio 学习环境”(FLE)的系统,提供了两种不同的测试模式。“实验模式” 包含24个结构化挑战,设定了具体目标和有限资源,任务从简单的两台机器建造到复杂的近百台机器工厂都有。而在 “开放模式” 下,AI 代理可以探索程序生成的地图,唯一目标是建造