Helix es un innovador modelo de visión-lenguaje-acción diseñado para el control general de robots humanoides. Combina la percepción visual, la comprensión del lenguaje y el control de acciones para resolver múltiples desafíos a largo plazo de los robots en entornos complejos. Las principales ventajas de Helix incluyen una potente capacidad de generalización, un uso eficiente de los datos y una arquitectura de red neuronal única que no requiere ajuste fino específico para cada tarea. El modelo está diseñado para proporcionar a los robots en entornos domésticos la capacidad de generar comportamientos instantáneos, permitiéndoles manipular objetos desconocidos. La aparición de Helix representa un importante avance en la capacidad de los robots para adaptarse a las situaciones cotidianas.