O modelo GPT-5 mais recente da OpenAI realizou uma grande evolução nos mecanismos de segurança, não recusando mais as solicitações dos usuários de forma simples e direta, mas adotando uma estratégia mais inteligente chamada "completo seguro".

Melhoria central: da rejeição binária para a explicação inteligente

Tradicionalmente, quando o ChatGPT considerava que uma solicitação do usuário violava as diretrizes de conteúdo, apenas dava uma desculpa curta e recusava. O GPT-5 mudou completamente esse padrão, transferindo o foco de segurança da análise da entrada do usuário para o monitoramento do conteúdo gerado pelo AI.

"Nossa forma de recusar é totalmente diferente da anterior", disse Saachi Jain, da equipe de pesquisa em sistemas de segurança da OpenAI. O novo modelo não apenas explica por que a solicitação é inadequada, mas também sugere temas alternativos em momentos apropriados, proporcionando uma experiência de interação mais construtiva ao usuário.

ChatGPT

Tratamento em níveis: nem todas as infrações são iguais

O GPT-5 introduziu o conceito de classificação de risco, aplicando estratégias diferentes com base na gravidade do potencial dano. "Não todas as violações das políticas devem ser tratadas da mesma forma; alguns erros são realmente mais graves do que outros", explicou Jain.

Essa mudança permite que o ChatGPT forneça respostas mais flexíveis e úteis, mantendo-se dentro das regras de segurança, em vez de recusar de forma genérica.

Experiência prática: sensação semelhante no uso cotidiano

Ainda que os mecanismos de segurança tenham sido aprimorados, o desempenho do GPT-5 em consultas diárias comuns — como problemas de saúde, receitas culinárias, ferramentas de estudo — é muito semelhante ao das versões anteriores. O novo modelo mantém sua utilidade habitual ao lidar com solicitações rotineiras.

Desafios ainda existem: funções personalizadas trazem novos riscos

É importante notar que, com o aumento das funcionalidades personalizadas dos ferramentas de IA, os controles de segurança tornaram-se mais complexos. Testes mostram que certas restrições de segurança ainda podem ser contornadas por meio de recursos como instruções personalizadas, o que nos lembra que a segurança da IA continua sendo um tema em constante evolução.