Le 10 mars, la société chinoise de robotique Zhiyuan a officiellement lancé son premier grand modèle de base incarné à usage général : Genie Operator-1 (GO-1). Cette annonce a suscité un vif intérêt, notamment en ce qui concerne son potentiel dans le domaine des robots de service domestique, ouvrant de nouvelles perspectives pour la gestion des tâches ménagères. Selon la présentation officielle de Zhiyuan, le grand modèle GO-1, ayant appris à partir d'un grand nombre de vidéos humaines, a démontré d'excellentes performances dans l'exécution de diverses tâches ménagères, telles que la remise de gobelets, la préparation de repas et l'accueil des invités.
En termes de performances techniques, GO-1 affiche une amélioration significative par rapport aux modèles existants, avec un taux de réussite moyen augmenté de 32 %. Des tests ont révélé que GO-1 excellait dans des tâches spécifiques comme verser de l'eau, nettoyer une surface et remplir des boissons. Zhiyuan Robotics attribue cette avancée à la nouvelle architecture Vision-Language-Latent-Action (ViLLA), qui exploite efficacement des ensembles de données de haute qualité et un grand nombre de données vidéo pour améliorer les capacités de généralisation du modèle.
Par ailleurs, fin de l'année dernière, Zhiyuan Robotics a annoncé, en collaboration avec plusieurs institutions, la mise en open source du projet AgiBot World, un ensemble de données réelles de plusieurs millions d'exemples. Cet ensemble de données couvre plus de 100 scénarios réels, dont 40 % de scénarios domestiques et 20 % de scénarios industriels. Il fournit une base essentielle pour l'entraînement et l'amélioration des capacités des robots.
Zhiyuan Robotics souligne que le grand modèle GO-1 possède plusieurs caractéristiques clés : premièrement, il est capable d'apprendre à partir de vidéos humaines, améliorant ainsi sa compréhension du comportement humain ; deuxièmement, il possède une forte capacité de généralisation rapide à partir de petits échantillons, pouvant s'adapter à de nouvelles tâches avec très peu de données, voire zéro donnée ; troisièmement, il peut être transféré entre différentes morphologies de robots, permettant une application flexible « un cerveau, plusieurs formes ». Grâce à une évolution continue, GO-1 peut acquérir des données à partir de son exécution réelle, optimisant et améliorant constamment ses propres capacités.
Cette annonce de Zhiyuan Robotics marque une étape importante vers la généralisation de l'intelligence incarnée pour les robots ménagers. Selon l'analyse de la société de courtage en valeurs mobilières Cinda Securities, les progrès de l'IA sont en train de révolutionner le développement de technologies telles que les robots humanoïdes et la conduite autonome. Les perspectives d'industrialisation future de l'industrie de la robotique humanoïde sont prometteuses.