OpenAI ha lanzado oficialmente ChatGPT Agent, esta nueva herramienta de inteligencia artificial marca un gran salto en la inteligencia artificial, pasando de ser un asistente de conversación a un ejecutor autónomo de tareas. ChatGPT Agent integra las funciones Operator y Deep Research lanzadas anteriormente por OpenAI, pudiendo acceder a través de navegadores virtuales, terminales y API, completar tareas complejas de forma autónoma, ahorrando tiempo y mejorando la eficiencia para los usuarios.

image.png

Funciones principales: de la conversación a la acción

ChatGPT Agent ya no se limita a conversaciones de texto, sino que puede navegar en Internet, hacer clic, rellenar formularios como lo haría un humano, e incluso ejecutar código y llamar a APIs. Puede manejar una variedad de tareas, como elegir ropa adecuada al presupuesto y estilo para una boda, planificar viajes, generar informes profesionales o crear presentaciones. OpenAI afirma que este agente está impulsado por el modelo GPT-4o, combinando la capacidad de interacción web del Operator y la funcionalidad de investigación profunda del Deep Research, creando un sistema inteligente unificado. Los usuarios solo necesitan dar una instrucción única, y el Agente puede completar tareas de múltiples pasos de forma autónoma, mejorando significativamente la productividad.

image.png

Rendimiento: superando los estándares de la industria

ChatGPT Agent muestra un rendimiento líder en varios tests de referencia. En la prueba "Humanity’s Last Exam", su precisión alcanzó el 41,6%, mucho más alto que el 20,3% del modelo anterior de OpenAI o3 y el 26,6% de Deep Research. En tareas de modelado en bancos de inversión, la precisión promedio del Agente fue del 71,3%, superando a competidores como Microsoft Co-pilot en tareas relacionadas con Excel y PowerPoint. Además, su desempeño en tareas de navegación web como BrowseComp y WebArena fue del 68,9% y 65,4% respectivamente, mostrando así una gran utilidad práctica.

Seguridad y limitaciones: el control del usuario es fundamental

OpenAI destaca que ChatGPT Agent fue diseñado con seguridad en mente. Al realizar operaciones de "alto impacto", como contraseñas o pagos, el Agente solicitará autorización explícita del usuario y permitirá pausar, interrumpir o tomar el control de la tarea en cualquier momento. Para prevenir sitios web maliciosos o ataques de inyección de instrucciones, OpenAI implementó medidas estrictas, incluyendo la limitación de operaciones sensibles (como transferencias bancarias) y la eliminación automática de datos de navegación. Además, el Agente se clasifica como nivel de "alta capacidad biológica y química", activando garantías de seguridad adicionales.

Disponibilidad y planes futuros

Actualmente, ChatGPT Agent está disponible para los usuarios de ChatGPT Pro, Plus y Team, los usuarios Pro tienen un límite de 400 tareas al mes, mientras que los usuarios Plus y Team tienen 40 tareas, y pueden comprar cupos adicionales si exceden el límite. OpenAI planea ampliar el acceso a empresas y usuarios educativos en las próximas semanas. Sin embargo, esta función aún no está disponible en la Unión Europea y Suiza. OpenAI también reveló que el Agente podría ser la base para modelos más poderosos, como el supuestamente anunciado GPT-5, y en el futuro podría integrar más funciones, como un sistema de liquidación de pagos.

La publicación de ChatGPT Agent ocurre en un momento de intensa competencia en la industria de la IA. Microsoft's Co-pilot, Google's Gemini y xAI's Grok están luchando por liderar la interfaz de productividad digital. Con la salida del Agente, OpenAI no solo refuerza su posición líder en el campo de la inteligencia artificial generativa, sino que también desafía a los programas tradicionales de búsqueda y oficina. Los expertos consideran que ChatGPT Agent podría redefinir la forma en que los usuarios interactúan con la red y las herramientas de productividad, convirtiéndose en un nuevo estándar para la automatización impulsada por la IA.

AIbase