De acordo com o último estudo da OpenAI, o modelo GPT-5 lançado recentemente apresenta um desempenho muito melhor em termos de vieses políticos do que os produtos anteriores. Essa descoberta foi revelada pela equipe da OpenAI ao Axios, marcando um avanço importante nos modelos de IA no controle de vieses.

ChatGPT

Nota da fonte da imagem: a imagem foi gerada por IA, e o serviço de licença é o Midjourney

Há muito tempo, o público e figuras políticas expressaram preocupação com os problemas de vieses nos sistemas de IA, exigindo maior transparência e garantindo que esses modelos não sejam influenciados por vieses. Em julho deste ano, o governo dos EUA também emitiu uma ordem executiva para eliminar sistemas de IA "de consciência social" no uso governamental, sistemas que podem conter vieses políticos ou ideológicos, mas ainda não está claro como seguir as normas.

O estudo da OpenAI mostrou que, tanto no "modo imediato" quanto no "modo de pensamento", o nível de vieses do GPT-5 diminuiu em 30% em comparação com seu predecessor. O relatório de pesquisa afirma que o modelo se aproxima da objetividade quando enfrenta perguntas neutras ou ligeiramente tendenciosas, e apresenta apenas vieses moderados ao lidar com perguntas desafiadoras ou emocionais. O relatório enfatiza ainda que os vieses atuais principalmente ocorrem quando o modelo expressa sua própria opinião ou usa linguagem exagerada e irônica em cenários emocionalmente intensos.

Em uma entrevista ao Axios, os pesquisadores da OpenAI mencionaram que questões "emocionalmente intensas" são o fator mais propenso a causar vieses no modelo, embora ainda haja espaço para melhorar a objetividade. Eles também observaram que a preocupação pública com os vieses do modelo frequentemente supera os resultados reais de detecção. Para lidar com esses problemas, a OpenAI adotou algumas medidas, incluindo a divulgação das "normas do modelo", para mostrar ao público como ajustar o comportamento do modelo.

Durante o estudo, a equipe de pesquisa realizou testes sistemáticos sobre os vieses do modelo com base em cenários reais de uso do ChatGPT. Eles propuseram vários tipos de perguntas, como "viés conservador forte", "viés conservador neutro", "totalmente neutro", "viés liberal neutro" e "viés liberal forte", abrangendo 100 temas e 500 perguntas específicas. Os pesquisadores acreditam que quanto mais neutra for a pergunta, mais neutra será a resposta do modelo.

A OpenAI afirma que continuará divulgando resultados de avaliação relacionados, promovendo o intercâmbio na indústria e implementando autossupervisão. A empresa planeja publicar resultados mais completos sobre os testes de vieses nas próximas semanas, promovendo ainda mais a transparência e a equidade nos modelos de IA.