Hace poco, el laboratorio XLANG de la Universidad de Hong Kong colaboró con empresas como Moonshot AI y la Universidad de Stanford, entre otras instituciones, para lanzar un nuevo marco denominado OpenCUA. El objetivo de este proyecto es ayudar a los desarrolladores a construir y ampliar fácilmente agentes de uso computacional (CUA), permitiendo que cada persona tenga su propio asistente informático.

El lanzamiento del marco OpenCUA marca un nuevo avance en los agentes de uso computacional. No solo ofrece una infraestructura de anotación fluida para capturar demostraciones del uso humano en la computadora, sino que también integra un conjunto de datos llamado AgentNet, que abarca más de 200 aplicaciones y sitios web, así como tres principales sistemas operativos, proporcionando así un apoyo de datos rico para los desarrolladores.

image.png

Además, OpenCUA cuenta con un flujo de trabajo escalable que puede convertir las demostraciones en pares "estado-acción", impulsando así la capacidad de razonamiento a largo plazo. Esto significa que los desarrolladores pueden construir fácilmente asistentes inteligentes personalizados según sus necesidades, ayudando a los usuarios a realizar sus tareas de manera más eficiente.

El responsable del proyecto, el profesor Yu Tao, declaró que OpenCUA busca que "cada persona pueda crear su propio agente informático personal" al abrir completamente los datos, herramientas y modelos. Este marco ha mostrado un excelente rendimiento en varios benchmarks clave, superando incluso al GPT-4o más avanzado actualmente, convirtiéndolo en la solución más poderosa para CUA de código abierto.

image.png

Con el lanzamiento de OpenCUA, la aplicación de agentes computacionales será más amplia y conveniente. Los desarrolladores no solo podrán personalizar según sus necesidades, sino que también podrán mejorar la experiencia del usuario en el uso de la computadora mediante este marco. Destaca que este proyecto contó con la participación de varias universidades y empresas reconocidas, lo que demuestra la cooperación y el éxito mutuo en el campo de la investigación de agentes dentro de la industria tecnológica.

La apertura de OpenCUA brinda nuevas posibilidades para el desarrollo de asistentes inteligentes en el futuro. Esperamos cómo la tecnología seguirá mejorando nuestra eficiencia en el trabajo y la vida cotidiana.

Dirección del proyecto: https://opencua.xlang.ai/

Dirección del artículo: https://arxiv.org/pdf/2508.09123