OpenAI anunció que su API principal, la API de Respuestas (Responses API), ahora admite el **Protocolo de Contexto del Modelo (MCP)** y ha realizado actualizaciones significativas en la generación de imágenes, el Interpretador de Código (Code Interpreter) y las herramientas de búsqueda de archivos. Estas mejoras simplifican enormemente el proceso de desarrollo de agentes inteligentes, permitiendo a los desarrolladores conectar agentes AI a herramientas y servicios externos con solo unas pocas líneas de código, lo que aumenta aún más la flexibilidad y funcionalidad de la API.
MCP compatible: simplificación del desarrollo de agentes inteligentes
OpenAI ha añadido soporte para MCP a través de la API de Respuestas, marcando otro avance importante en el campo del desarrollo de agentes inteligentes. MCP (Protocolo de Contexto del Modelo) es un protocolo que conecta modelos de IA con herramientas y servicios externos. Los desarrolladores solo necesitan unas pocas líneas de código para integrar funciones complejas. Por ejemplo:
- Con **9 líneas de código**, se puede conectar un agente inteligente al sistema de comercio electrónico **Shopify** para interactuar sin problemas con el sistema de comercio electrónico.
- Con **13 líneas de código**, se puede conectar un agente inteligente a la plataforma de comunicación en la nube **Twilio** para soportar funciones de comunicación en tiempo real.
Además, OpenAI anunció su ingreso en el Comité Directivo de MCP para impulsar el desarrollo de este ecosistema, proporcionando soluciones estandarizadas para la integración de herramientas a los desarrolladores.
Generación de imágenes: previsualización en tiempo real y edición multi-paso
La API de Respuestas ahora está integrada con el último modelo de generación de imágenes de OpenAI, **gpt-image-1**, otorgando a los desarrolladores capacidades visuales más potentes. Las nuevas características incluyen:
- **Previsualización en tiempo real**: los desarrolladores pueden ver los resultados de la generación de imágenes en tiempo real durante el proceso.
- **Edición multi-paso**: permite ajustar y optimizar iterativamente las imágenes, permitiendo a los desarrolladores realizar modificaciones detalladas según sus necesidades.
Esta actualización se basa en el popular modelo GPT-4o, cuya capacidad de generar imágenes provocó una ola de interés en estilos como el anime de Studio Ghibli, mostrando su versatilidad en la generación de estilos variados.
Interpretador de Código: análisis de datos e imagen procesamiento
La herramienta actualizada **Interpretador de Código (Code Interpreter)** mejora aún más la utilidad de la API de Respuestas, permitiendo a los modelos de IA:
- Ejecutar tareas de análisis de datos complejas.
- Resolver problemas matemáticos avanzados.
- Procesar y manipular datos de imágenes, como generar o editar imágenes mediante código.
Esta función proporciona poderosas herramientas a los desarrolladores, aplicables a una variedad de escenarios desde el análisis financiero hasta el desarrollo de software.
Búsqueda de archivos: eficiente recuperación de información cruzada
Las mejoras en las herramientas de búsqueda de archivos permiten a los agentes inteligentes extraer información relevante de documentos de manera más eficiente. Las funciones actualizadas incluyen:
- Extraer bloques de contenido relacionado según las consultas del usuario.
- Soportar búsquedas cruzadas en múltiples fuentes de datos, mejorando la amplitud y precisión de la recuperación de información.
Esta actualización ofrece un mayor soporte para aplicaciones en investigación de mercado, educación y desarrollo de software, entre otros campos.
OpenAI señaló que los nuevos servicios están disponibles al mismo precio que las tasas actuales. Por ejemplo:
- El Interpretador de Código se cobra por sesión a 0,03 dólares por sesión.
- La búsqueda de archivos se cobra 2,50 dólares por cada 1.000 llamadas, con un costo de almacenamiento de 0,10 dólares por GB/día (el primer GB es gratuito).
- La generación de imágenes se cobra según la resolución y calidad del nivel, con un precio inicial de 0,011 dólares por imagen.
Todas estas funciones están disponibles desde el 21 de mayo de 2025, y los desarrolladores pueden encontrar guías detalladas en la documentación oficial de OpenAI.
Conclusión
Esta actualización de la API de Respuestas de OpenAI, con soporte para MCP, mejoras en la generación de imágenes, el Interpretador de Código y las herramientas de búsqueda de archivos, proporciona a los desarrolladores herramientas más potentes y flexibles. Ya sea para conectar servicios externos como Shopify o Twilio, o para realizar análisis de datos complejos y procesamiento de imágenes, la API de Respuestas demuestra un gran potencial en el desarrollo de agentes inteligentes. Los desarrolladores ahora pueden implementar aplicaciones de IA más complejas con menos código, marcando un paso importante hacia la implementación práctica de tecnologías de IA.
Plataforma de desarrolladores de OpenAI: https://platform.openai.com