Noticias de IA

No te pierdas ningún momento de la innovación global en IA

IA Diario

Tendencias diarias de la industria de la IA en tres minutos

Cronología de la IA

Hitos de la industria de la IA

Al hardware

lista todos los productos de hardware AI.

Guía de Monetización de la IA

Últimos Casos

Compartiendo casos de monetización de IA

Colección de Imágenes

Casos de monetización de creación de imágenes con IA

Colección de Videos

Casos de monetización de creación de videos con IA

Colección de Audio

Casos de monetización de creación de audio con IA

Colección de Contenido

Casos de monetización de redacción de contenido con IA

Tutoriales de IA

Últimos Tutoriales

Compartiendo gratuitamente los últimos tutoriales de IA

Rankings de Productos de IA

Ranking de Productos de IA

Muestra el ranking de visitas totales de sitios web de IA

Ranking de Crecimiento de Tráfico de IA

Rastrea los sitios web de IA de más rápido crecimiento por tráfico

Ranking de Descenso de Tráfico de IA

Se centra en los sitios web de IA con descensos de tráfico significativos

Ranking Semanal de IA

Muestra el ranking semanal de visitas de sitios web de IA

Rankings de Países Populares

Estados Unidos

Sitios web de IA más populares entre los usuarios estadounidenses

China

Sitios web de IA más populares entre los usuarios chinos

India

Sitios web de IA más populares entre los usuarios indios

Brasil

Sitios web de IA más populares entre los usuarios brasileños

Rankings de Categorías Populares

Generación de Imágenes

Ranking total de visitas de sitios web de generación de imágenes con IA

Asistente Personal

Ranking total de visitas de sitios web de asistentes personales con IA

Generación de Personajes

Ranking total de visitas de sitios web de generación de personajes con IA

Generación de Videos

Ranking total de visitas de sitios web de generación de videos con IA

Rankings de Datos de Código Abierto Populares

Ranking de Proyectos de IA

Proyectos de IA populares en GitHub por estrellas totales

Ranking de Crecimiento de Proyectos de IA

Proyectos de IA populares en GitHub por tasa de crecimiento

Ranking de Desarrolladores de IA

Ranking de desarrolladores de IA populares en GitHub

Ranking de Organizaciones de IA

Ranking de organizaciones de IA populares en GitHub

Categorías de Código Abierto Populares

Deepseek

Proyectos de código abierto de Deepseek populares en GitHub

TTS

Proyectos de código abierto de TTS populares en GitHub

LLM

Proyectos de código abierto de LLM populares en GitHub

ChatGPT

Proyectos de código abierto de ChatGPT populares en GitHub

Biblioteca de Proyectos de Código Abierto de IA

Visión General

Visión general de los proyectos de código abierto de IA populares en GitHub

Biblioteca de productos Navegación de herramientas MCP

DeepSeek podría haber utilizado los datos de Google Gemini para entrenar su nuevo modelo de IA

AIbase基地

Publicado elNoticias de IA · 5 minutos de lectura · Jun 4, 2025

Recientemente, DeepSeek lanzó una nueva actualización de su modelo de IA de推理 R1, que demostró un excelente rendimiento en varias pruebas de matemáticas y programación. Sin embargo, DeepSeek no reveló la fuente de los datos con los que entrenó el modelo, lo que ha generado preguntas entre algunos investigadores de IA y especulaciones de que el modelo podría haber sido parcialmente entrenado utilizando datos de la serie Gemini AI de Google.

El desarrollador de Melbourne, Sam Paeach, afirmó que descubrió que el modelo R1-0528 de DeepSeek tiene muchas similitudes en el uso de palabras y expresiones con Gemini2.5Pro de Google. Aunque esto no constituye evidencia directa, otro desarrollador — el fundador anónimo del proyecto SpeechMap — también mencionó que las "huellas de pensamiento" generadas por el modelo de DeepSeek durante el proceso de razonamiento son idénticas a las de Gemini. Esta conclusión volvió a suscitar discusiones sobre si DeepSeek utilizó datos de competidores durante el entrenamiento.

DeepSeek

Fuente de la imagen: Imagen generada por IA, proveedor de licencias Midjourney

A principios del año pasado, DeepSeek fue acusado de usar el propio nombre de OpenAI's ChatGPT en su modelo V3, lo que sugiere que el modelo podría haber sido entrenado usando registros de chat de ChatGPT. A principios de este año, OpenAI informó a los medios que había encontrado evidencia relacionada con la tecnología de "destilación de datos", un método para entrenar nuevos modelos extrayendo información de grandes modelos. Según Bloomberg, Microsoft descubrió a finales de 2024 que gran parte de los datos se habían filtrado a través de cuentas de desarrollador de OpenAI, que podrían estar relacionadas con DeepSeek.

A pesar de que la tecnología de "destilación" no es infrecuente en la comunidad de IA, OpenAI ha establecido explícitamente que está prohibido utilizar los resultados de sus modelos para construir productos competitivos. Es importante tener en cuenta que debido al alto contenido de bajo nivel en la red abierta, muchos modelos de IA tienden a imitar incorrectamente los tonos y expresiones de otros durante el entrenamiento, lo que complica aún más el análisis profundo de las fuentes de entrenamiento.

El experto en inteligencia artificial Nathan Lambert considera que no sería imposible que DeepSeek haya utilizado datos de Gemini de Google para su entrenamiento. Mencionó que DeepSeek cuenta con suficiente financiación para aprovechar los mejores modelos API disponibles para generar datos sintéticos. Para evitar que los datos sean destilados, las empresas de IA están implementando continuamente medidas de seguridad. Por ejemplo, OpenAI ya ha comenzado a requerir la verificación de identidad para acceder a ciertos modelos avanzados, mientras que Google también está mejorando la seguridad de su plataforma AI Studio, limitando el acceso a las huellas de generación del modelo.

DeepSeek Modelo de inferencia R1 GeminiAI modelo de IA

Este artículo proviene de AIbase Daily

¡Bienvenido a la columna [AI Diario]! Aquí está tu guía diaria para explorar el mundo de la inteligencia artificial. Todos los días te presentamos el contenido más destacado en el campo de la IA, centrándonos en los desarrolladores para ayudarte a comprender las tendencias tecnológicas y conocer las aplicaciones innovadoras de productos de IA.

—— Creado por el grupo AIbase Daily

Noticias de IA relacionadas recomendadas

El servicio de recarga de la API de la plataforma abierta DeepSeek se ha restablecido oficialmente

Con la restauración del servicio de recarga, DeepSeek también ha ajustado los precios de llamada de algunos modelos. El período de promoción del modelo deepseek-chat ha finalizado, y el precio de llamada del modelo V3 en el que se basa se ha ajustado a 2 yuanes por millón de tokens de entrada y 8 yuanes por millón de tokens de salida. El precio de llamada del modelo R1 en el que se basa el modelo deepseek-reasoner es de 4 yuanes por millón de tokens de entrada y 16 yuanes por millón de tokens de salida.

Feb 25, 2025