電腦遊戲《Factorio》成爲 AI 能力評估的新工具
《Factorio》是一款複雜的電腦遊戲,專注於建造與資源管理,最近成爲研究人員評估人工智能能力的新工具。這款遊戲能夠測試語言模型在規劃和構建複雜系統的能力,同時管理多個資源和生產鏈。爲此,研究團隊開發了一個名 “Factorio 學習環境”(FLE)的系統,提供了兩種不同的測試模式。“實驗模式” 包含24個結構化挑戰,設定了具體目標和有限資源,任務從簡單的兩臺機器建造到複雜的近百臺機器工廠都有。而在 “開放模式” 下,AI 代理可以探索程序生成的地圖,唯一目標是建造