La startup de l'intelligence artificielle basée à San Francisco, Prime Intellect, a officiellement lancé « Environments Hub », une plateforme ouverte permettant de construire et de partager des environnements d'apprentissage par renforcement (RL), visant à s'opposer à l'écosystème fermé dominé par les grands laboratoires d'intelligence artificielle.
Prime Intellect souligne que les environnements d'entraînement interactifs sont devenus un goulot d'étranglement clé pour le développement de l'IA suivant. Dans l'apprentissage par renforcement, les agents d'IA apprennent en interagissant avec des environnements guidés par des règles ; seule la confrontation à des changements dynamiques peut permettre d'atteindre une véritable intelligence. « Sans interaction avec l'environnement, l'apprentissage par renforcement n'est qu'une question de mathématiques », affirme la société.
Au cours des dernières années, plusieurs grands laboratoires ont investi massivement dans le développement d'environnements RL propriétaires, rendant progressivement les données d'entraînement privées. Cette tendance rend de plus en plus difficile pour la communauté open source de former des modèles d'IA compétitifs. Prime Intellect espère offrir une alternative ouverte via Environments Hub, afin d'éviter d'être enfermé dans un « jardin clos ».
Environments Hub soutiendra le prochain modèle open source INTELLECT-3
Prime Intellect prévoit d'utiliser Environments Hub comme moteur de données de son prochain modèle d'agent open source INTELLECT-3. Ce modèle sera entraîné sur des données d'environnements RL provenant des contributions de la communauté et sera positionné comme « un modèle d'agent complètement ouvert et avancé ».
Pour stimuler la construction d'environnements, Prime Intellect a lancé une série de tâches avec récompense en espèces, cherchant des environnements d'apprentissage par renforcement capables d'évaluer la qualité du code, de soutenir des tâches prolongées, voire même de favoriser l'écriture créative. L'objectif est de réduire les barrières à l'entrée et de permettre à davantage de développeurs de participer à la construction de modèles d'IA avancés.
Équipe décentralisée et équipe d'investisseurs prestigieux
Prime Intellect a été fondée par Vincent Weisser (actif dans le domaine de la science décentralisée, DeSci) et Johannes Hagemann (qui a dirigé l'entraînement de grands modèles chez Aleph Alpha). La société s'engage dans l'IA décentralisée, le partage des ressources de calcul et l'entraînement de modèles dans les systèmes distribués.