O Factorio Learning Environment (FLE) é uma nova estrutura construída com base no jogo Factorio, usada para avaliar a capacidade de modelos de linguagem de grande porte (LLMs) em planejamento de longo prazo, síntese de programas e otimização de recursos. À medida que os LLMs saturam gradualmente os testes de benchmark existentes, o FLE fornece uma nova maneira de avaliação aberta. Sua importância reside na capacidade de permitir que os pesquisadores entendam de forma mais completa e profunda as vantagens e desvantagens dos LLMs. As principais vantagens são os desafios abertos e de dificuldade exponencial, possuindo dois protocolos de avaliação: tarefas estruturadas e tarefas abertas. Este projeto foi desenvolvido por Jack Hopkins e outros, lançado como código aberto, gratuito para uso, com o objetivo de impulsionar a pesquisa de pesquisadores de IA em habilidades de agentes em domínios complexos e abertos.