Uma startup de inteligência artificial com sede em San Francisco, Prime Intellect, lançou oficialmente o "Environments Hub", uma plataforma aberta para criar e compartilhar ambientes de aprendizado por reforço (RL), com o objetivo de combater a ecologia fechada dominada por grandes laboratórios de inteligência artificial.
A Prime Intellect afirma que os ambientes de treinamento interativos tornaram-se um dos principais gargalos para o próximo estágio do desenvolvimento da IA. No aprendizado por reforço, os agentes de IA aprendem interagindo com ambientes guiados por regras, e só alcançam verdadeira inteligência quando enfrentam mudanças dinâmicas. "Sem interação com o ambiente, o aprendizado por reforço é apenas matemática", diz a empresa.
Nos últimos anos, vários laboratórios grandes investiram grandes quantias de dinheiro no desenvolvimento de ambientes RL proprietários, tornando cada vez mais difícil para a comunidade de código aberto treinar modelos de IA competitivos. A Prime Intellect espera oferecer uma alternativa aberta por meio do Environments Hub, evitando ser aprisionada em "jardins cercados".
O Environments Hub suportará o próximo modelo de código aberto INTELLECT-3
A Prime Intellect planeja utilizar o Environments Hub como motor de dados para seu próximo modelo de agente de código aberto, o INTELLECT-3. Esse modelo será treinado com dados de ambientes RL contribuídos pela comunidade e será posicionado como "um modelo de agente totalmente aberto e avançado".
Para impulsionar a construção de ambientes, a Prime Intellect lançou uma série de tarefas com prêmios em dinheiro, buscando ambientes de aprendizado por reforço capazes de avaliar a qualidade do código, suportar tarefas de longa duração ou até mesmo promover a escrita criativa. O objetivo é reduzir as barreiras para o desenvolvimento, permitindo que mais desenvolvedores participem da construção de modelos de IA avançados.
Equipe descentralizada e equipe de investidores renomados
A Prime Intellect foi fundada por Vincent Weisser (que atuou no campo de ciência descentralizada, DeSci) e Johannes Hagemann (que liderou o treinamento de grandes modelos na Aleph Alpha). A empresa se dedica à IA descentralizada, ao compartilhamento de recursos de computação e ao treinamento de modelos em sistemas distribuídos.