La empresa de inteligencia artificial emergente Prime Intellect, con sede en San Francisco, ha lanzado oficialmente el "Environments Hub", una plataforma abierta para construir y compartir entornos de aprendizaje por refuerzo (RL), con el objetivo de contrarrestar la ecosfera cerrada dominada por laboratorios de inteligencia artificial grandes.
Prime Intellect señala que los entornos de entrenamiento interactivos se han convertido en un cuello de botella clave para el desarrollo de la siguiente fase de la IA. En el aprendizaje por refuerzo, los agentes de IA aprenden interactuando con entornos impulsados por reglas, y solo pueden lograr una verdadera inteligencia cuando enfrentan cambios dinámicos. "Sin interacción con el entorno, el aprendizaje por refuerzo es solo matemáticas", dijo la empresa.
A lo largo de los últimos años, varios laboratorios grandes han invertido grandes cantidades de dinero en desarrollar entornos RL propietarios, convirtiendo gradualmente los datos de entrenamiento en privados. Esta tendencia está haciendo que la comunidad de código abierto tenga cada vez más dificultades para entrenar modelos de IA competitivos. Prime Intellect espera ofrecer una alternativa abierta a través del Environments Hub, evitando quedar atrapada en un "jardín cercado".
El Environments Hub apoyará al modelo de código abierto de próxima generación INTELLECT-3
Prime Intellect planea utilizar el Environments Hub como motor de datos para su próximo modelo de agente de código abierto, INTELLECT-3. Este modelo se entrenará utilizando datos de entornos de RL proporcionados por la comunidad, y se posicionará como un "modelo de agente completamente abierto y de vanguardia".
Para impulsar la construcción de entornos, Prime Intellect ha lanzado una serie de tareas con premios en efectivo, buscando entornos de aprendizaje por refuerzo capaces de evaluar la calidad del código, soportar tareas de ejecución prolongada e incluso fomentar la escritura creativa. El objetivo es reducir la barrera de entrada, permitiendo que más desarrolladores participen en la creación de modelos avanzados de IA.
Equipo descentralizado y una lista de inversores destacados
Prime Intellect fue fundada conjuntamente por Vincent Weisser (que estuvo activo en el ámbito de la ciencia descentralizada DeSci) y Johannes Hagemann (que lideró el entrenamiento de grandes modelos en Aleph Alpha). La empresa se dedica a la IA descentralizada, al compartir recursos de cómputo y a entrenar modelos en sistemas distribuidos.