El Instituto de Zhiyuan lanzó oficialmente los últimos resultados del sistema de inteligencia corporal — la versión RoboBrain2.0 de 32B y el marco colaborativo de cerebro y cuerpo a gran escala RoboOS2.0 en modo de máquina individual. RoboBrain2.0, como un "cerebro corporal general", combina las capacidades de percepción, razonamiento y planificación, logrando avances significativos en varios benchmarks autorizados. En comparación con la versión anterior de 7B, la nueva versión tiene una capacidad más potente de comprensión espacial y temporal, permitiendo que realice tareas complejas en entornos físicos reales.

Las características de RoboBrain2.0 incluyen una capacidad precisa de comprensión espacial, una capacidad de planificación a largo plazo y una capacidad de razonamiento a largo plazo, lo que permite que los robots trabajen eficientemente en entornos complejos. Gracias al diseño modular de arquitectura, RoboBrain2.0 integra diversos tipos de información como imágenes, videos e instrucciones de lenguaje, soportando el análisis de escenas complejas en tiempo real.

Además, RoboOS2.0, como el primer framework SaaS de inteligencia corporal en todo el mundo, utiliza una arquitectura sin servidor, permitiendo una implementación ligera. Este framework permite que la inteligencia del cerebro se coopere eficientemente con diferentes tipos de robots, impulsando el desarrollo de los robots desde la "inteligencia individual" hacia la "inteligencia colectiva". A través de la tienda de habilidades RoboSkill, los usuarios pueden obtener fácilmente y adaptar diversos módulos de habilidades robóticas.

image.png

En cuanto al rendimiento, RoboBrain2.0 mejoró significativamente la capacidad de comprensión y toma de decisiones de los robots gracias a conjuntos de datos multimodales y estrategias de entrenamiento por etapas. En diversos benchmarks de evaluación, el modelo ha superado repetidamente registros, demostrando una excelente capacidad de razonamiento espacial y temporal. A través de varios niveles de entrenamiento, RoboBrain2.0 no solo ha adquirido la percepción espacial básica y el modelado temporal, sino que también ha mostrado una notable capacidad de razonamiento en tareas complejas de inteligencia corporal.

Estas dos nuevas tecnologías del Instituto Zhiyuan impulsarán aún más el desarrollo de la aplicación de la inteligencia corporal, permitiendo que los robots tomen decisiones autónomas en entornos más complejos y mejoren la eficiencia operativa.

Actualmente, RoboBrain2.0 y RoboOS2.0 están disponibles de forma abierta, con todos los pesos del modelo, código de entrenamiento y benchmarks de evaluación disponibles.

RoboBrain2.0:

  • GitHub: https://github.com/FlagOpen/RoboBrain2.0

  • Checkpoint-32B: https://huggingface.co/BAAI/RoboBrain2.0-32B

    Imagenes multichip de FlagRelease para RoboBrain2.0:

  • https://huggingface.co/FlagRelease/RoboBrain2.0-32B-FlagOS

RoboOS2.0:

  • GitHub: https://github.com/FlagOpen/RoboOS

Destacados:

🌟 La versión de 32B de RoboBrain2.0 rompió récords en múltiples benchmarks autorizados, contando con una poderosa capacidad de comprensión espacial y temporal.  

🤖 RoboOS2.0 logró la colaboración entre cuerpos, apoyando la cooperación de múltiples agentes inteligentes y impulsando el desarrollo de la inteligencia colectiva.  

📊 El lanzamiento de estas nuevas tecnologías mejorará significativamente la capacidad de comprensión y toma de decisiones de los robots en entornos complejos.