26 de abril de 2025. AIbase informa: OpenAI ha anunciado recientemente que la función de generación de imágenes de su modelo multimodal insignia, GPT-4o, ya está integrada oficialmente en la función GPT personalizados de ChatGPT. Esta actualización significa que los asistentes de IA personalizados creados por los usuarios pueden generar y editar imágenes directamente, ofreciendo más posibilidades en áreas como la creación de contenido, el diseño y la educación.

QQ_1745714143685.png

Experiencia de generación de imágenes integrada a la perfección

La función de generación de imágenes de GPT-4o se lanzó gradualmente a los usuarios gratuitos, Plus, Pro y Team de ChatGPT y la plataforma Sora a partir del 25 de marzo de 2025. A diferencia del pasado, donde se dependía de modelos externos como DALL-E3, la capacidad de generación de imágenes de GPT-4o está integrada en el propio modelo y permite generar imágenes de alta calidad directamente a partir de indicaciones de texto. Ahora, esta función se extiende a los GPT personalizados, y los usuarios pueden activar la opción "Generación de imágenes GPT-4o" en el editor de GPT personalizados de ChatGPT para crear un asistente de IA exclusivo con capacidad de generación de imágenes. Esta actualización reemplaza el backend anterior de DALL-E3, mejorando significativamente la velocidad de generación y la calidad de las imágenes.

Puntos destacados y escenarios de aplicación

La aplicación de la generación de imágenes GPT-4o en los GPT personalizados muestra una gran flexibilidad y utilidad. Los usuarios pueden generar imágenes con realismo fotográfico, ilustraciones estilizadas o activos de diseño complejos mediante indicaciones de lenguaje natural. Estas son sus principales ventajas:

Renderizado preciso de texto: GPT-4o puede incrustar texto claro y legible con precisión en las imágenes, lo que resulta ideal para generar contenido como gráficos, menús, invitaciones o infografías.

Optimización de la interacción multironda: Los usuarios pueden ajustar gradualmente los detalles de la imagen a través del diálogo, y el modelo puede mantener la coherencia del contexto, lo que resulta adecuado para escenarios que requieren varias iteraciones, como el diseño de personajes, el desarrollo de activos de marca o la creación de storyboards.

Cumplimiento de instrucciones complejas: El modelo admite el procesamiento de indicaciones detalladas que incluyen de 10 a 20 objetos, garantizando la representación precisa de las relaciones y características de los objetos.

Adaptación a estilos diversos: Desde el realismo hasta el dibujo animado, desde el dibujo a mano alzada hasta la alta resolución, GPT-4o puede generar imágenes de diversos estilos artísticos para satisfacer diferentes necesidades creativas.

Por ejemplo, un GPT personalizado en el sector de la moda puede generar bocetos de diseños de ropa, un GPT en el sector educativo puede crear gráficos didácticos intuitivos, y un GPT en el sector del marketing puede generar rápidamente materiales publicitarios para redes sociales. Estas funciones ofrecen a los usuarios la posibilidad de crear contenido visual de alta calidad sin necesidad de conocimientos de diseño profesional.

Método de uso y limitaciones

Para utilizar la función de generación de imágenes de GPT-4o, los usuarios deben activar la opción correspondiente en el editor de GPT personalizados de ChatGPT y describir la imagen deseada mediante indicaciones de texto, especificando detalles como códigos de color, relación de aspecto o fondo transparente. El proceso de generación puede tardar de unos segundos a un minuto, dependiendo de la complejidad de la indicación. A pesar de su potencia, la implementación actual presenta algunas limitaciones. Por ejemplo, algunos usuarios han informado de que la estabilidad de la generación de imágenes en el cumplimiento de las instrucciones de GPT personalizados es de aproximadamente el 50%, lo que indica que la función aún se encuentra en fase experimental. Además, las imágenes grandes, como los carteles, pueden presentar problemas de recorte que requieren optimización. OpenAI afirma que mejorará la estabilidad y el rendimiento de la función mediante actualizaciones continuas.

Amplio acceso y seguridad

Actualmente, la función de generación de imágenes GPT-4o está disponible para todos los niveles de suscripción de ChatGPT, incluidos los usuarios gratuitos (con un límite diario de 3 usos). Se espera que las empresas, los usuarios educativos y los desarrolladores de API obtengan acceso en las próximas semanas. Para garantizar la seguridad del contenido, todas las imágenes generadas incorporan metadatos C2PA para indicar su origen, y OpenAI también ha implementado herramientas de búsqueda interna y sistemas de revisión para restringir estrictamente la generación de contenido que implique personas reales, desnudos o violencia.

Profundo impacto en los desarrolladores

Para los desarrolladores, el próximo lanzamiento de la API de generación de imágenes GPT-4o impulsará aún más su integración en las aplicaciones. En comparación con los modelos tradicionales de generación de imágenes, la arquitectura multimodal de GPT-4o reduce los costes de cambio entre modelos y ofrece una experiencia de desarrollo más fluida. Esta actualización también sugiere que OpenAI está trabajando en la construcción de una pila de tecnología multimodal unificada entre ChatGPT, Sora y la API, con la posibilidad de ampliar las funciones en el futuro.

Perspectivas futuras

La aplicación de la función de generación de imágenes GPT-4o en los GPT personalizados no solo mejora la utilidad de los asistentes de IA, sino que también proporciona a los usuarios herramientas de creación más intuitivas y eficientes. Aunque aún es necesario abordar algunos desafíos técnicos, como la estabilidad del cumplimiento de las instrucciones y los problemas de recorte de imágenes, su potencial es evidente. AIbase prevé que, a medida que OpenAI siga optimizando el modelo y ampliando el acceso a la API, GPT-4o provocará una mayor transformación en los campos de la creación de contenido, el diseño comercial y la educación. AIbase continuará haciendo un seguimiento de los últimos avances de GPT-4o para ofrecerle una visión profunda de las tecnologías de IA de vanguardia.