OpenAI anunció recientemente una actualización integral de su SDK para Agentes, trayendo varias funciones importantes para los desarrolladores. Esta actualización no solo expande el soporte para lenguajes de programación, sino que también introduce tecnología interactiva innovadora basada en voz.
El SDK para Agentes ahora admite oficialmente TypeScript, con funcionalidades equivalentes a la versión de Python. Los desarrolladores pueden utilizar mecanismos de control detallado y opciones de aprobación manual para gestionar con mayor precisión el comportamiento de los agentes IA. Este SDK está diseñado específicamente para simplificar los flujos de trabajo multiagente, proporcionando modelos de lenguaje configurables, funcionalidad de cambio de agente, control de seguridad integrado y un completo conjunto de herramientas de análisis.
Avances en tecnología de agentes vocales
La nueva función de RealtimeAgent es el punto culminante de esta actualización. Ahora los desarrolladores pueden crear agentes vocales que funcionen tanto en el cliente como en el servidor, estos agentes admiten interrupciones de voz y pueden invocar herramientas diversas en tiempo real durante las conversaciones.
El tablero de "Traces" también ha sido actualizado significativamente, mostrando datos en tiempo real del funcionamiento de los agentes vocales, incluidos el estado del flujo de audio, el uso de herramientas y las estadísticas de interrupciones, proporcionando a los desarrolladores un monitoreo integral del rendimiento.
OpenAI también mejoró los modelos de lenguaje subyacentes que sostienen estas funciones. La versión actualizada "GPT-4O-Realtime-Preview-2025-06-03" ha mejorado notablemente la precisión en la ejecución de instrucciones, la confiabilidad en la invocación de herramientas y la elegancia en el manejo de interrupciones. Este modelo ya está disponible para los desarrolladores a través de las APIs de chat y en tiempo real.
Cambio en la estrategia de API
En cuanto al plan de ruta del producto, OpenAI planea, después de lograr equivalencia de funciones a mediados de 2026, eliminar gradualmente el existente API de Asistentes y adoptar completamente la nueva API de Respuestas. La API de Completaciones de Chat seguirá disponible para los desarrolladores que no necesiten integración de herramientas, pero OpenAI recomienda a los desarrolladores migrar lo antes posible a la API de Respuestas para obtener funciones más potentes de expansión.
El SDK para Agentes es compatible con total flexibilidad con la API de OpenAI y otros proveedores de terceros que sigan el estándar de Completaciones de Chat, proporcionando a los desarrolladores una amplia variedad de opciones.