DeepSeek lanza la versión V3.1, el tamaño de la ventana de contexto se duplica hasta 128K tokens

AIbase基地

Publicado elNoticias de IA · 6 minutos de lectura · Aug 19, 2025

20.6k

Beijing, 19 de agosto de 2025 — DeepSeek ha anunciado oficialmente la última iteración de su modelo de lenguaje a gran escala, DeepSeek-V3.1, que aumenta significativamente la capacidad de ventana de contexto de 64k tokens a 128k tokens manteniendo la compatibilidad completa con las API, lo que marca un importante hito en el campo de la tecnología de inteligencia artificial de código abierto.

Mejoras técnicas y posicionamiento del mercado

El DeepSeek-V3.1 se lanzó solo cinco meses después de la versión anterior, DeepSeek-V3-0324. La versión V3-0324 fue lanzada en marzo de este año y logró mejoras notables en indicadores clave como la capacidad de razonamiento, la eficiencia de programación y los cálculos matemáticos, lo que proporcionó una base sólida para la optimización posterior en la versión V3.1.

Bajo el creciente entorno competitivo global en tecnología de inteligencia artificial, la rápida estrategia de actualización de productos de DeepSeek demuestra claramente su capacidad de innovación tecnológica y velocidad de respuesta al mercado. A pesar de las restricciones impuestas por sanciones internacionales sobre el acceso a recursos de cálculo de alto nivel, DeepSeek sigue manteniendo una ventaja competitiva sólida en el campo de modelos de lenguaje a gran escala de código abierto mediante métodos de entrenamiento eficientes y estrategias de optimización innovadoras.

Características técnicas principales

Capacidad ampliada para procesar contexto: La mejora principal en la versión V3.1 es el doble de la capacidad de la ventana de contexto, lo que permite al modelo manejar secuencias más largas de diálogos múltiples y tareas de consulta complejas, ofreciendo así una experiencia de interacción más coherente y profunda a los usuarios.

Optimización de la estructura de salida: Según los comentarios de usuarios iniciales, el V3.1 ha realizado importantes mejoras en el estilo de expresión lingüística; ahora el modelo tiende a generar contenido con una estructura definida, incluyendo datos formateados como tablas y listas, mejorando así la legibilidad y utilidad de la información.

Capacidad mejorada para comprender física: En la nueva versión, se observa una mejora notable en la simulación de fenómenos físicos y la comprensión de conceptos relacionados, lo que brinda un mayor respaldo para aplicaciones en cálculos científicos e ingeniería.

Arquitectura continua y optimizada: El V3.1 continúa utilizando el diseño de arquitectura de "Mezcla de Expertos" (MoE, Mixture of Experts) ya probado, y está especialmente optimizado para tareas de razonamiento habitual; en dichos escenarios no es necesario activar el modo "DeepThink" de pensamiento profundo, garantizando así la eficiencia de procesamiento y la calidad de la salida.

Implementación y compatibilidad

El DeepSeek-V3.1 ya está disponible en varios plataformas, incluyendo el sitio web oficial de DeepSeek, aplicaciones móviles y miniaplicaciones de WeChat, entre otros canales principales de acceso para los usuarios. La empresa destacó especialmente la compatibilidad total con las API, asegurando que los usuarios y desarrolladores existentes puedan migrar sin problemas a la nueva versión sin necesidad de modificar el código de integración o el método de invocación existente.

Compromiso con el código abierto y planificación futura

Aunque hasta la fecha Hugging Face aún no ofrece archivos de pesos del modelo V3.1 para descarga, DeepSeek reafirmó su compromiso a largo plazo con la comunidad de código abierto, prometiendo continuar con su estrategia de lanzamientos de código abierto y proporcionar apoyo técnico a la comunidad global de investigación en inteligencia artificial y a los desarrolladores.

Microsoft lanza un nuevo modelo de agente de IA rStar2-Agent con 14 mil millones de parámetros para desafiar los modelos a gran escala

Microsoft ha logrado un avance significativo en el campo de la inteligencia artificial, abriendo un modelo de razonamiento de agente de IA llamado rStar2-Agent. Este modelo utiliza un método innovador de aprendizaje por refuerzo del agente inteligente. Sorprendentemente, a pesar de tener solo 14 mil millones de parámetros, alcanzó una tasa de precisión del 80,6% en la prueba de razonamiento matemático AIME24, superando exitosamente al DeepSeek-R1 con 671 mil millones de parámetros (79,8%). Este rendimiento hace que las personas reevalúen la relación entre el tamaño de los parámetros del modelo y su rendimiento.

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

Model Providers

Submit Your Model

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

GEO Services

DeepSeek lanza la versión V3.1, el tamaño de la ventana de contexto se duplica hasta 128K tokens

AIbase基地

Mejoras técnicas y posicionamiento del mercado

Características técnicas principales

Implementación y compatibilidad

Compromiso con el código abierto y planificación futura

Este artículo proviene de AIbase Daily

Noticias de IA relacionadas recomendadas

Google lanza EmbeddingGemma: un modelo de incrustación de texto eficiente para dispositivos móviles

¡Dream Image 4.0: lanzamiento importante: generación de imágenes a partir de texto, edición de imágenes y generación de series de imágenes todo en uno!

ASML invierte 1.300 millones de euros y se convierte en el principal accionista de Mistral AI

Microsoft lanza un nuevo modelo de agente de IA rStar2-Agent con 14 mil millones de parámetros para desafiar los modelos a gran escala

La empresa de IA Flock Safety busca eliminar el crimen en EE.UU. con cámaras inteligentes

¡La IA ayuda a leer de forma eficiente! Los libros electrónicos se convierten en mapas mentales en un instante. Análisis inteligente de archivos EPUB y PDF

Informes de MIT revelan que el 95% de los proyectos de GenAI empresariales fracasan, críticos lo consideran demasiado simplificado

El modelo de generación de videos Google Veo 3 llega a Google Photos, imágenes estáticas se convierten en videos dinámicos

La empresa de IA Sierra, fundada por el ex CEO de Salesforce, recibe una financiación de 3.500 millones de dólares y alcanza un valor de 100.000 millones de dólares

KakaoTalk integrará la función de ChatGPT, las aplicaciones de mensajería surcoreanas experimentan una mejora en inteligencia artificial

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

Model Providers

Submit Your Model

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

GEO Services​

DeepSeek lanza la versión V3.1, el tamaño de la ventana de contexto se duplica hasta 128K tokens

AIbase基地

Mejoras técnicas y posicionamiento del mercado

Características técnicas principales

Implementación y compatibilidad

Compromiso con el código abierto y planificación futura

Este artículo proviene de AIbase Daily

Noticias de IA relacionadas recomendadas

Google lanza EmbeddingGemma: un modelo de incrustación de texto eficiente para dispositivos móviles

¡Dream Image 4.0: lanzamiento importante: generación de imágenes a partir de texto, edición de imágenes y generación de series de imágenes todo en uno!

ASML invierte 1.300 millones de euros y se convierte en el principal accionista de Mistral AI

Microsoft lanza un nuevo modelo de agente de IA rStar2-Agent con 14 mil millones de parámetros para desafiar los modelos a gran escala

La empresa de IA Flock Safety busca eliminar el crimen en EE.UU. con cámaras inteligentes

¡La IA ayuda a leer de forma eficiente! Los libros electrónicos se convierten en mapas mentales en un instante. Análisis inteligente de archivos EPUB y PDF

Informes de MIT revelan que el 95% de los proyectos de GenAI empresariales fracasan, críticos lo consideran demasiado simplificado

El modelo de generación de videos Google Veo 3 llega a Google Photos, imágenes estáticas se convierten en videos dinámicos

La empresa de IA Sierra, fundada por el ex CEO de Salesforce, recibe una financiación de 3.500 millones de dólares y alcanza un valor de 100.000 millones de dólares

KakaoTalk integrará la función de ChatGPT, las aplicaciones de mensajería surcoreanas experimentan una mejora en inteligencia artificial

GEO Services