DeepSeek pode ter usado os dados do Google Gemini para treinar o novo modelo de IA

AIbase基地

Publicado emNotícias e Informações de IA · 5 minutos de leitura · Jun 4, 2025

Recentemente, a DeepSeek lançou uma nova atualização do modelo de IA de推理 R1, que demonstrou um desempenho excepcional em várias avaliações matemáticas e de programação. No entanto, a DeepSeek não revelou as fontes de dados usadas no treinamento de seu modelo, levantando dúvidas entre alguns pesquisadores de IA que especulam que o modelo pode ter sido parcialmente treinado com base na série de modelos Gemini da Google.

O desenvolvedor de Melbourne, Sam Paeach, afirmou que encontrou muitas semelhanças no uso de palavras e expressões entre o modelo R1-0528 da DeepSeek e o Gemini2.5Pro da Google. Embora isso não seja uma evidência direta, outro desenvolvedor — o fundador anônimo do projeto SpeechMap — também mencionou que os "traços de pensamento" gerados pelo modelo da DeepSeek durante o processo de推理 são praticamente idênticos aos da Gemini. Essa descoberta reacendeu os debates sobre se a DeepSeek utilizou dados de concorrentes durante o treinamento.

Fonte da imagem: Imagem gerada por IA, licenciada pelo provedor Midjourney

Ao longo do mês de dezembro passado, a DeepSeek já havia sido criticada por frequentemente identificar-se como o ChatGPT da OpenAI em seu modelo V3, sugerindo que talvez tenha sido treinado com registros de conversas do ChatGPT. Mais cedo este ano, a OpenAI informou à imprensa que havia encontrado evidências relacionadas à técnica conhecida como "data distillation", que é um método de treinamento de novos modelos a partir de informações extraídas de grandes modelos. A Bloomberg relatou que, no final de 2024, a Microsoft, parceira da OpenAI, descobriu que grande parte dos dados foi roubada através de contas de desenvolvedores da OpenAI que podem estar ligadas à DeepSeek.

Embora a técnica de "refino" não seja incomum na comunidade de IA, a OpenAI especificamente proibiu o uso de seus modelos para criar produtos concorrentes. É importante notar que, devido ao grande volume de conteúdo de baixa qualidade na web aberta, muitos modelos de IA tendem a imitar erroneamente as palavras e frases uns dos outros durante o treinamento. Isso torna ainda mais complexa a análise das fontes de dados de treinamento.

O especialista em inteligência artificial Nathan Lambert acredita que não seria impossível que a DeepSeek tenha usado os dados da Gemini da Google durante o treinamento. Ele menciona que a DeepSeek tem recursos financeiros suficientes para aproveitar os melhores modelos via API e gerar dados sintéticos. Para evitar que dados sejam refinados, as empresas de IA estão constantemente fortalecendo suas medidas de segurança. Por exemplo, a OpenAI começou a exigir verificação de identidade para organizações acessarem certos modelos avançados, enquanto a Google está aumentando a segurança de sua plataforma AI Studio, limitando o acesso às trajetórias geradas pelos modelos.

DeepSeek modelo de inferência R1 GeminiAI modelo de IA

Este artigo é do AIbase Daily

Bem-vindo à coluna [AI Daily]! Este é o seu guia para explorar o mundo da inteligência artificial todos os dias. Todos os dias apresentamos os destaques da área de IA, com foco nos desenvolvedores, para o ajudar a obter insights sobre as tendências tecnológicas e a compreender as aplicações inovadoras de produtos de IA.

—— Criado pelo Grupo AIbase Daily

Notícias de IA Relacionadas Recomendadas

Jornal da IA: Yuan Yuan da Tencent é atualizado para buscar imagens e vídeos com uma única frase; WeChat Pay MCP é lançado; Google lança Veo 3 em todo o mundo

Bem-vindo ao programa 【Jornal da IA】! Aqui é o seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos os conteúdos mais recentes do setor de IA, focando nos desenvolvedores, ajudando você a compreender as tendências tecnológicas e conhecer aplicações inovadoras de produtos de IA. Produtos de IA novos: https://top.aibase.com/1. Yuan Yuan da Tencent é novamente atualizado: busque com uma única frase, imagens e vídeos são exibidos imediatamente, tornando a obtenção de informações mais direta! A nova função do Yuan Yuan da Tencent torna a obtenção de informações mais direta e eficiente. Os usuários precisam apenas fazer uma pergunta para obter conteúdo textual e visual.

Jul 4, 2025

O ByteDance abriu o Trae-Agent, ajudando na nova experiência de desenvolvimento inteligente

Jul 4, 2025

Pagamento WeChat MCP lançado: a perfeita combinação de IA e pagamentos, abrindo uma nova era comercial

Jul 4, 2025

Figma planeja listar-se na Nasdaq com uma avaliação de cerca de 20 bilhões de dólares, o futuro da IA em design parece promissor

A empresa de software de design colaborativo em nuvem Figma, com sede em San Francisco, apresentou oficialmente à Comissão de Valores Mobiliários dos Estados Unidos (SEC) o pedido de IPO, com o objetivo de ser listada na bolsa de valores de Nova York (NYSE), sob o código de ações FIG. Segundo informações recentes, a avaliação almejada pela Figma é de cerca de 20 bilhões de dólares e ela tem boas perspectivas de se tornar uma das principais ofertas públicas iniciais de tecnologia em 2025. Este artigo foi compilado pela equipe de edição da AIbase, baseado em informações públicas da internet, analisando profundamente o contexto do IPO da Figma, inovações tecnológicas e

Jul 4, 2025

Google lança novo modelo de geração de vídeo Veo 3 em todo o mundo

O Google anunciou oficialmente a lançamento mundial do seu novo modelo de geração de vídeo Veo3. Essa notícia é aguardada há muito tempo pelos usuários, e o Veo3 já está disponível para usuários Gemini em mais de 159 países, oferecendo uma nova experiência de criação de vídeos. As características do modelo de geração de vídeo Veo3 incluem a capacidade de gerar vídeos com até oito segundos a partir de simples dicas de texto. Segundo a Google, essa tecnologia foi projetada especialmente para usuários criativos, especialmente para os usuários das redes sociais que têm crescente demanda por conteúdo curto.

Jul 4, 2025

Aviso da Hitachi Energy: Flutuações na demanda por energia dos centros de IA podem ameaçar a estabilidade do fornecimento global de energia

Recentemente, o CEO da Hitachi Energy, maior fabricante mundial de transformadores, Andreas Schierenbeck, em entrevista ao Financial Times, destacou que, com o aumento repentino da demanda por energia das grandes empresas de tecnologia no treinamento de modelos de inteligência artificial, os governos precisam tomar medidas para limitar essas flutuações, garantindo assim a estabilidade do fornecimento de energia. Nota da fonte da imagem: as imagens são geradas por IA e fornecidas pela Midjourney. Schierenbeck afirmou que as flutuações na demanda por energia dos centros de dados da IA são extremamente intensas,

Jul 4, 2025

A Meta lança um assistente de chat ativo para que a IA entre em contato com você primeiro

Recentemente, a Meta está testando um novo tipo de assistente de chat, que enviará mensagens ativamente aos usuários, em vez de apenas responder após o usuário iniciar uma conversa. Imagine que você está conversando com amigos no Facebook Messenger ou no WhatsApp quando de repente um assistente de chat de IA chamado "O Mestre da Magia do Cinema" lhe envia uma mensagem: Espero que tenha um bom dia! Eu me pergunto se você teve alguma novidade recentemente.

Jul 4, 2025

Tencent Yuanbao é atualizado novamente: uma única frase de pesquisa, imagens e vídeos apresentados imediatamente, obtenção de informações mais intuitiva!

O assistente inteligente Yuanbao anunciou hoje uma atualização significativa em sua funcionalidade de pesquisa central, introduzindo uma nova característica chamada 'pesquisa com uma única frase, pesquisando mais'. Agora, os usuários precisam apenas fazer uma pergunta simples e o Yuanbao corresponderá e apresentará conteúdo de imagens e canais de vídeo de forma inteligente, tornando a obtenção de informações mais rica e intuitiva do que nunca. No passado, o Yuanbao já conseguia lidar facilmente com demandas diárias como consulta sobre tempo, cotações de ações e localizações. Mas esta atualização leva as capacidades de pesquisa inteligente do Yuanbao a um novo nível. Seja para aprender uma nova habilidade ou resolver pequenos problemas do dia a dia, o Yuanbao pode integrar textos

Jul 4, 2025

Cluely duplica sua receita anual em uma semana, chegando a 7 milhões de dólares

A startup emergente Cluely, que está em alta na Silicon Valley, anunciou recentemente que sua Receita Anual Recorrente (ARR) subiu rapidamente para cerca de 7 milhões de dólares após o lançamento de um novo produto empresarial. Essa velocidade de crescimento deixou o fundador Roy Lee empolgado, que disse ao 'Tech Crunch': 'Toda pessoa que participa de reuniões ou entrevistas está testando esse produto'. A Cluely se dedica a usar inteligência artificial para analisar conversas online, fornecendo registros de reuniões, informações de fundo e sugestões de perguntas em tempo real, todas apresentadas silenciosamente na tela do usuário,

Jul 4, 2025

Jingdong Logistics lança caminhão leve autônomo de sua própria pesquisa - JieDong Logistics VAN nível L4 de direção autônoma em vias públicas

Na recente 17ª Exposição Internacional de Tecnologia e Equipamentos para Transporte, a Jingdong Logistics apresentou pela primeira vez seu produto de caminhão leve autônomo desenvolvido internamente - Jingdong Logistics VAN. Este caminhão leve autônomo possui um espaço de carga de 24 metros cúbicos, tornando-o o maior caminhão leve autônomo do setor de logística até o momento, podendo substituir os ônibus tradicionais de 4,2 metros nos processos de transporte e transbordo da logística. Segundo informações divulgadas, o Jingdong Logistics VAN possui uma autonomia de até 400 km com carga completa e capacidade de direção autônoma nivel L4 em vias públicas. Isso significa que ele pode se autoconduzir.

Jul 4, 2025

Notícias de IA

IA Diário

Linha do Tempo da IA

Al hardware

Casos Recentes

Coleção de Imagens

Coleção de Vídeos

Coleção de Áudios

Coleção de Conteúdo

Tutoriais Recentes

Ranking de Produtos de IA

Ranking de Crescimento de Tráfego de IA

Ranking de Queda de Tráfego de IA

Ranking Semanal de IA

Estados Unidos

China

Índia

Brasil

Geração de Imagens

Assistente Pessoal

Geração de Personagens

Geração de Vídeos

Ranking de Projetos de IA

Ranking de Crescimento de Projetos de IA

Ranking de Desenvolvedores de IA

Ranking de Organizações de IA

Deepseek

TTS

LLM

ChatGPT

Visão Geral

DeepSeek pode ter usado os dados do Google Gemini para treinar o novo modelo de IA

AIbase基地

Este artigo é do AIbase Daily

Notícias de IA Relacionadas Recomendadas

Jornal da IA: Yuan Yuan da Tencent é atualizado para buscar imagens e vídeos com uma única frase; WeChat Pay MCP é lançado; Google lança Veo 3 em todo o mundo

O ByteDance abriu o Trae-Agent, ajudando na nova experiência de desenvolvimento inteligente

Pagamento WeChat MCP lançado: a perfeita combinação de IA e pagamentos, abrindo uma nova era comercial

Figma planeja listar-se na Nasdaq com uma avaliação de cerca de 20 bilhões de dólares, o futuro da IA em design parece promissor

​Google lança novo modelo de geração de vídeo Veo 3 em todo o mundo

Aviso da Hitachi Energy: Flutuações na demanda por energia dos centros de IA podem ameaçar a estabilidade do fornecimento global de energia

A Meta lança um assistente de chat ativo para que a IA entre em contato com você primeiro

Tencent Yuanbao é atualizado novamente: uma única frase de pesquisa, imagens e vídeos apresentados imediatamente, obtenção de informações mais intuitiva!

Cluely duplica sua receita anual em uma semana, chegando a 7 milhões de dólares

Jingdong Logistics lança caminhão leve autônomo de sua própria pesquisa - JieDong Logistics VAN nível L4 de direção autônoma em vias públicas

Google lança novo modelo de geração de vídeo Veo 3 em todo o mundo