El modelo GPT-5 más reciente de OpenAI ha logrado un gran avance en sus mecanismos de seguridad, ya no rechaza las solicitudes de los usuarios de manera simple y brusca, sino que utiliza una estrategia más inteligente llamada "completado seguro".

Mejoras principales: De la negación binaria a la explicación inteligente

Tradicionalmente, cuando ChatGPT consideraba que una solicitud del usuario violaba las normas de contenido, solo ofrecía una breve disculpa y un rechazo. El GPT-5 ha cambiado completamente este modelo, trasladando el enfoque de seguridad del análisis de las entradas del usuario hacia el monitoreo del contenido generado por la IA.

"Nuestro modo de rechazar es radicalmente diferente al pasado", dijo Saachi Jain del equipo de investigación de sistemas de seguridad de OpenAI. El nuevo modelo no solo explica la razón de la infracción, sino que también sugiere temas alternativos en momentos adecuados, brindando así una experiencia de interacción más constructiva al usuario.

ChatGPT

Tratamiento por niveles: No todos los incumplimientos son igualmente graves

El GPT-5 introduce el concepto de clasificación de riesgos, aplicando estrategias diferentes según la gravedad del potencial daño. "No todos los incumplimientos deben tratarse por igual, algunos errores son realmente más graves que otros", explicó Jain.

Este cambio permite a ChatGPT ofrecer respuestas más flexibles y útiles mientras cumple con las reglas de seguridad, en lugar de rechazar de forma generalizada.

Experiencia práctica: La sensación en el uso cotidiano es similar

Aunque los mecanismos de seguridad han mejorado, el rendimiento del GPT-5 en consultas diarias para usuarios comunes —como preguntas sobre salud, elaboración de recetas o herramientas de estudio— es prácticamente similar al de versiones anteriores. El nuevo modelo mantiene su utilidad habitual al manejar solicitudes ordinarias.

Desafíos aún presentes: Las funciones personalizadas traen nuevos riesgos

Destaca que, con el aumento de las funciones personalizadas de las herramientas de IA, los controles de seguridad se vuelven más complejos. Las pruebas muestran que ciertas limitaciones de seguridad aún pueden evitarse mediante funciones como instrucciones personalizadas, lo que nos recuerda que la seguridad de la IA sigue siendo un tema en constante evolución.