O modelo GPT-5 mais recente da OpenAI realizou uma grande evolução nos mecanismos de segurança, não recusando mais as solicitações dos usuários de forma simples e direta, mas adotando uma estratégia mais inteligente chamada "completo seguro".
Melhoria central: da rejeição binária para a explicação inteligente
Tradicionalmente, quando o ChatGPT considerava que uma solicitação do usuário violava as diretrizes de conteúdo, apenas dava uma desculpa curta e recusava. O GPT-5 mudou completamente esse padrão, transferindo o foco de segurança da análise da entrada do usuário para o monitoramento do conteúdo gerado pelo AI.
"Nossa forma de recusar é totalmente diferente da anterior", disse Saachi Jain, da equipe de pesquisa em sistemas de segurança da OpenAI. O novo modelo não apenas explica por que a solicitação é inadequada, mas também sugere temas alternativos em momentos apropriados, proporcionando uma experiência de interação mais construtiva ao usuário.

Tratamento em níveis: nem todas as infrações são iguais
O GPT-5 introduziu o conceito de classificação de risco, aplicando estratégias diferentes com base na gravidade do potencial dano. "Não todas as violações das políticas devem ser tratadas da mesma forma; alguns erros são realmente mais graves do que outros", explicou Jain.
Essa mudança permite que o ChatGPT forneça respostas mais flexíveis e úteis, mantendo-se dentro das regras de segurança, em vez de recusar de forma genérica.
Experiência prática: sensação semelhante no uso cotidiano
Ainda que os mecanismos de segurança tenham sido aprimorados, o desempenho do GPT-5 em consultas diárias comuns — como problemas de saúde, receitas culinárias, ferramentas de estudo — é muito semelhante ao das versões anteriores. O novo modelo mantém sua utilidade habitual ao lidar com solicitações rotineiras.
Desafios ainda existem: funções personalizadas trazem novos riscos
É importante notar que, com o aumento das funcionalidades personalizadas dos ferramentas de IA, os controles de segurança tornaram-se mais complexos. Testes mostram que certas restrições de segurança ainda podem ser contornadas por meio de recursos como instruções personalizadas, o que nos lembra que a segurança da IA continua sendo um tema em constante evolução.





