Quanto mais inteligente, mais capaz de mentir? Estudo alerta para o aumento de respostas enganosas de IA!

AIbase基地

Publicado emNotícias e Informações de IA · 5 minutos de leitura · Sep 29, 2024

119

À medida que os chatbots de inteligência artificial evoluem, eles não apenas se tornam mais poderosos e capazes de responder a perguntas com mais excelência, mas também surge uma preocupação: esses IAs "inteligentes" parecem mais propensos a mentir do que a recusar responder a perguntas que não conseguem processar.

Robô Inteligência Artificial IA

Nota da fonte: Imagem gerada por IA, fornecida pelo serviço de licenciamento de imagens Midjourney

Um estudo recente revelou esse fenômeno, publicado na revista Nature, analisando vários modelos de linguagem líderes de mercado, incluindo o GPT da OpenAI, o LLaMA do Meta e o modelo de código aberto BLOOM.

O estudo mostra que, embora as respostas dessas IAs se tornem mais precisas em muitos casos, sua confiabilidade diminuiu como um todo, com uma proporção maior de respostas incorretas do que em modelos mais antigos.

O coautor do estudo, José Hernandez-Orallo, observa: "Hoje em dia, eles respondem praticamente a qualquer pergunta, o que significa que há mais respostas corretas, mas também mais respostas incorretas." Mike Hicks, filósofo da ciência e tecnologia da Universidade de Glasgow, que não participou do estudo, comentou: "Isso parece ser o que chamamos de 'balela', eles estão ficando melhores em fingir que sabem."

No estudo, os modelos foram questionados sobre uma variedade de tópicos, de matemática a geografia, e também tiveram que executar tarefas como listar informações em uma ordem específica. Embora os modelos maiores e mais poderosos fornecessem respostas mais precisas no geral, eles tiveram um desempenho pior em questões mais difíceis, com uma precisão menor.

Os pesquisadores apontam que o GPT-4 e o o1 da OpenAI se destacaram ao responder perguntas, respondendo quase todas. No entanto, todos os modelos de linguagem estudados apresentaram essa tendência, especialmente os modelos da série LLaMA, nos quais nenhum modelo atingiu uma precisão de 60% em perguntas simples. Em poucas palavras, quanto maior o modelo, mais parâmetros e dados de treinamento ele possui, maior a proporção de respostas incorretas.

Apesar da crescente capacidade das IAs de lidar com problemas complexos, seus erros no tratamento de problemas simples ainda são preocupantes. Os pesquisadores acreditam que podemos ser atraídos pelo desempenho desses modelos em problemas complexos, ignorando suas deficiências óbvias em problemas simples.

Para resolver esse problema, os pesquisadores sugerem que um limite possa ser definido para os modelos de linguagem, permitindo que o chatbot diga: "Desculpe, não sei", quando a questão se tornar complexa. No entanto, as empresas de IA podem não querer fazer isso, pois isso pode expor as limitações da tecnologia.

Destaques:
🔍 Os chatbots de IA estão se tornando mais poderosos, mas também aumenta a probabilidade de mentir.
📉 O estudo mostra que quanto maior o modelo de linguagem, maior a proporção de respostas incorretas.
🤖 Os pesquisadores sugerem definir um limite de resposta para a IA, incentivando-a a recusar responder a perguntas incertas.

Inteligência Artificial Chatbots OpenAI LLaMA

Este artigo é do AIbase Daily

Bem-vindo à coluna [AI Daily]! Este é o seu guia para explorar o mundo da inteligência artificial todos os dias. Todos os dias apresentamos os destaques da área de IA, com foco nos desenvolvedores, para o ajudar a obter insights sobre as tendências tecnológicas e a compreender as aplicações inovadoras de produtos de IA.

—— Criado pelo Grupo AIbase Daily

Notícias de IA Relacionadas Recomendadas

Descobrindo os segredos dos grandes modelos! A quantidade de informações surpreendente por trás das palavras de pensamento

Recentemente, uma equipe de pesquisa da Universidade Renmin da China, do Laboratório de Inteligência Artificial de Xangai, da Universidade College London e da Universidade de Dalian revelou uma descoberta importante no processo de raciocínio de grandes modelos: quando o modelo está pensando, as "palavras de pensamento" realmente refletem um aumento significativo na quantidade de informações internas. Este estudo, que utiliza métodos da teoria da informação, oferece uma nova perspectiva para compreender melhor o mecanismo de raciocínio da inteligência artificial. Você já pode ter visto grandes modelos produzindo linguagem que parece humana ao responder perguntas, como "Hmm...", "Deixe-me pensar..."

Jul 4, 2025

E Ink lança painel de toque com inteligência artificial: a tecnologia de papel eletrônico pode mudar a forma como interagimos com os notebooks

A empresa E Ink anunciou recentemente que desenvolveu um novo painel de toque para notebooks, que utiliza a mesma tecnologia de papel eletrônico encontrada em leitores eletrônicos. Esse produto inovador não se trata apenas de aumentar o tamanho do painel de toque ou adicionar funções secundárias de exibição, mas sim de posicioná-lo como uma plataforma dedicada para aplicações de IA e assistentes, visando operar paralelamente com os sistemas operacionais principais. A E Ink divulgou uma imagem da versão protótipo do painel de toque, que inclui uma tela de tinta eletrônica colorida, semelhante ao Kindle Color de Amazon.

Jul 4, 2025

Revolução do código aberto! Kyutai TTS lançado: síntese de voz com baixo latência, nova era para a inteligência artificial de voz!

Recentemente, o laboratório de inteligência artificial francês Kyutai anunciou que seu novo modelo de texto para fala Kyutai TTS foi oficialmente aberto ao público, oferecendo uma solução de síntese de voz de alto desempenho e baixa latência para desenvolvedores e pesquisadores ao redor do mundo. Essa lançamento revolucionário não apenas impulsionou o desenvolvimento de tecnologias de IA de código aberto, mas também abriu novas possibilidades para aplicativos de interação de voz multilíngue. O AIbase oferece uma análise exclusiva sobre esse destaque tecnológico e seu potencial impacto. Baixa latência, nova experiência em interação em tempo real. O Kyutai TTS se destacou por seu desempenho excepcional.

Jul 4, 2025

MiniMax lança o primeiro modelo de inteligência artificial de grande escala de código aberto do mundo, uma inovação tecnológica que chama a atenção da indústria

Jul 4, 2025

CoreWeave lança primeiramente o chip de inteligência artificial mais recente da NVIDIA, impulsionando a inovação na indústria da computação em nuvem

Recentemente, a NVIDIA e a CoreWeave anunciaram que o chip da GPU de inteligência artificial mais recente da NVIDIA, o Blackwell Ultra, já foi implantado comercialmente na CoreWeave. Esta notícia certamente injetou nova vitalidade nos serviços de computação em nuvem baseados em IA. A Dell também afirmou que a CoreWeave recebeu equipamentos personalizados baseados no sistema GB300NVL72AI da NVIDIA, o que marca a CoreWeave como a primeira empresa a instalar um sistema baseado no Blackwe

Jul 4, 2025

Ex- pesquisador da OpenAI revela: assinar com a Meta não rendeu 1 bilhão de dólares em bônus

Recentemente, as declarações de um ex-pesquisador da OpenAI geraram grande atenção. Ele afirmou que, apesar de a empresa Meta ter dito que ofereceria um bônus de até 1 bilhão de dólares para atrair talentos da OpenAI, ele e seus colegas não receberam esse dinheiro. Essa notícia certamente levantou dúvidas sobre os métodos de recrutamento da Meta. Fonte das imagens: as imagens foram geradas por IA, o serviço de licenciamento das imagens é realizado pelo Midjourney. Esse pesquisador se chama Lucas Beyer, ele e seu colega Ya

Jul 4, 2025

A empresa de design de chips Ambiq Micro solicita IPO nos EUA, beneficiando-se da demanda do mercado impulsionada pela inteligência artificial generativa

Jul 4, 2025

Novo andamento no processo judicial sobre direitos autorais da OpenAI: O New York Times terá acesso a dados de usuários excluídos

Em um longo processo judicial por violação de direitos autorais do New York Times contra a OpenAI, houve um avanço significativo. Segundo o Ars Technica, o juiz federal responsável pelo caso autorizou o New York Times e seus co-réus, o New York Daily News e o Center for Investigative Reporting, a acessar os registros de usuários da OpenAI, incluindo conteúdo excluído, para identificar com precisão o alcance da violação. O New York Times acredita que os usuários do ChatGPT podem excluir registros após contornarem o muro de pagamento, e por isso é necessário realizar uma coleta em larga escala de dados.

Jul 4, 2025

Loja de Aplicativos da Xiaomi lança área especializada em agentes de inteligência artificial, com parceria inicial com a plataforma de agentes de inteligência de Weni da Baidu

A partir de julho, a Loja de Aplicativos da Xiaomi começará a disponibilizar gradualmente o serviço de distribuição de agentes de inteligência artificial para os usuários. Após abrir o aplicativo da Loja de Aplicativos da Xiaomi, clique no novo ícone de 【Agentes】 na parte inferior para acessar diretamente a área especializada e navegar e experimentar diversos produtos úteis e interessantes de agentes de inteligência artificial. Além disso, os usuários também podem localizar rapidamente os serviços necessários por meio da função de pesquisa, sem precisar baixar ou instalar, realmente realizando uma experiência prática e conveniente de "abrir e usar imediatamente". Este novo modelo não apenas reduz a barreira para os usuários obterem serviços de inteligência artificial, mas também melhora a eficiência de contato com os serviços por meio de recomendações contextualizadas. É algo que merece atenção.

Jul 3, 2025

Explorando a compatibilidade de LLM com aprendizado por reforço: a Universidade de Ciência e Tecnologia da China revela as diferenças entre Llama e Qwen, apresentando o OctoThinker

Grandes modelos de linguagem (LLM) obtiveram avanços significativos em tarefas de raciocínio complexo ao combinar dicas de tarefas e aprendizado por reforço em larga escala (RL), como os modelos Deepseek-R1-Zero que aplicaram diretamente o aprendizado por reforço em modelos básicos, demonstrando uma forte capacidade de raciocínio. No entanto, esse sucesso é difícil de replicar em diferentes séries de modelos básicos, especialmente na série Llama. Isso levanta uma questão central: quais fatores causam as diferenças nas performances dos modelos básicos durante o processo de aprendizado por reforço? O aprendizado por reforço no

Jul 3, 2025

Notícias de IA

IA Diário

Linha do Tempo da IA

Al hardware

Casos Recentes

Coleção de Imagens

Coleção de Vídeos

Coleção de Áudios

Coleção de Conteúdo

Tutoriais Recentes

Ranking de Produtos de IA

Ranking de Crescimento de Tráfego de IA

Ranking de Queda de Tráfego de IA

Ranking Semanal de IA

Estados Unidos

China

Índia

Brasil

Geração de Imagens

Assistente Pessoal

Geração de Personagens

Geração de Vídeos

Ranking de Projetos de IA

Ranking de Crescimento de Projetos de IA

Ranking de Desenvolvedores de IA

Ranking de Organizações de IA

Deepseek

TTS

LLM

ChatGPT

Visão Geral

Quanto mais inteligente, mais capaz de mentir? Estudo alerta para o aumento de respostas enganosas de IA!

AIbase基地

Este artigo é do AIbase Daily

Notícias de IA Relacionadas Recomendadas

Descobrindo os segredos dos grandes modelos! A quantidade de informações surpreendente por trás das palavras de pensamento

E Ink lança painel de toque com inteligência artificial: a tecnologia de papel eletrônico pode mudar a forma como interagimos com os notebooks

Revolução do código aberto! Kyutai TTS lançado: síntese de voz com baixo latência, nova era para a inteligência artificial de voz!

MiniMax lança o primeiro modelo de inteligência artificial de grande escala de código aberto do mundo, uma inovação tecnológica que chama a atenção da indústria

​CoreWeave lança primeiramente o chip de inteligência artificial mais recente da NVIDIA, impulsionando a inovação na indústria da computação em nuvem

​Ex- pesquisador da OpenAI revela: assinar com a Meta não rendeu 1 bilhão de dólares em bônus

A empresa de design de chips Ambiq Micro solicita IPO nos EUA, beneficiando-se da demanda do mercado impulsionada pela inteligência artificial generativa

Novo andamento no processo judicial sobre direitos autorais da OpenAI: O New York Times terá acesso a dados de usuários excluídos

Loja de Aplicativos da Xiaomi lança área especializada em agentes de inteligência artificial, com parceria inicial com a plataforma de agentes de inteligência de Weni da Baidu

Explorando a compatibilidade de LLM com aprendizado por reforço: a Universidade de Ciência e Tecnologia da China revela as diferenças entre Llama e Qwen, apresentando o OctoThinker

CoreWeave lança primeiramente o chip de inteligência artificial mais recente da NVIDIA, impulsionando a inovação na indústria da computação em nuvem

Ex- pesquisador da OpenAI revela: assinar com a Meta não rendeu 1 bilhão de dólares em bônus