Le Laboratoire Zhiyuan a officiellement dévoilé les derniers résultats du système d'intelligence incarnée — la version 2.0 de RoboBrain avec 32 milliards de paramètres, ainsi que le cadre de coordination cerveau-cortex à grande échelle RoboOS 2.0 en version monoposte. RoboBrain 2.0, considéré comme un « cerveau généraliste pour robots », intègre des capacités de perception, de raisonnement et de planification, et a obtenu des résultats remarquables dans plusieurs tests standardisés. Comparé à la version précédente de 7 milliards de paramètres, cette nouvelle version possède une capacité plus puissante en cognition temporelle et spatiale, permettant d'exécuter des tâches complexes dans des environnements physiques réels.

Les caractéristiques de RoboBrain 2.0 incluent une compréhension précise de l'espace, une capacité de planification à long terme et une capacité de raisonnement en chaîne longue, ce qui permet aux robots de fonctionner efficacement dans des environnements complexes. Grâce à une architecture modulaire, RoboBrain 2.0 intègre diverses informations telles que des images, des vidéos et des instructions en langage naturel, et soutient l'analyse en temps réel de scénarios complexes.

En outre, RoboOS 2.0, premier cadre open source SaaS d'intelligence incarnée au monde, utilise une architecture sans serveur, permettant une mise en œuvre légère. Ce cadre permet une collaboration efficace entre le cerveau intelligent et différents types de robots, favorisant ainsi le passage de l'« intelligence monoposte » à l'« intelligence collective ». Grâce au magasin de compétences RoboSkill, les utilisateurs peuvent facilement obtenir et adapter divers modules de compétences robotiques.

image.png

En termes de performance, RoboBrain 2.0 repose sur un ensemble de données multimodales et une stratégie d'entraînement par étapes, améliorant significativement la capacité de compréhension et de prise de décision des robots. Le modèle a souvent battu des records dans divers tests, démontrant une excellente capacité de raisonnement spatial et temporel. Après plusieurs étapes d'entraînement, RoboBrain 2.0 a non seulement maîtrisé la perception spatiale de base et le modèle temporel, mais a également démontré une excellente capacité de raisonnement dans des tâches complexes d'intelligence incarnée.

Les deux nouvelles technologies développées par le Laboratoire Zhiyuan accéléreront davantage le développement des applications d'intelligence incarnée, permettant aux robots de prendre des décisions autonomes dans des environnements plus complexes et d'améliorer l'efficacité opérationnelle.

Aujourd'hui, RoboBrain 2.0 et RoboOS 2.0 sont entièrement open source, et les poids du modèle, le code d'entraînement et les critères d'évaluation sont tous accessibles.

RoboBrain 2.0:

  • GitHub : https://github.com/FlagOpen/RoboBrain2.0

  • Checkpoint-32B : https://huggingface.co/BAAI/RoboBrain2.0-32B

    Image multichip de RoboBrain 2.0 (FlagRelease):

  • https://huggingface.co/FlagRelease/RoboBrain2.0-32B-FlagOS

RoboOS 2.0:

  • GitHub : https://github.com/FlagOpen/RoboOS

Points clés :

🌟 La version 32B de RoboBrain 2.0 bat plusieurs records sur des benchmarks reconnus, disposant d'une forte capacité de cognition temporelle et spatiale.  

🤖 RoboOS 2.0 permet une coordination inter-corps, supporte la collaboration multi-intelligences et favorise le développement de l'intelligence collective.  

📊 L'introduction de ces nouvelles technologies améliorera significativement la capacité de compréhension et de prise de décision des robots dans des environnements complexes.