Beijing, 19 de agosto de 2025 — DeepSeek ha anunciado oficialmente la última iteración de su modelo de lenguaje a gran escala, DeepSeek-V3.1, que aumenta significativamente la capacidad de ventana de contexto de 64k tokens a 128k tokens manteniendo la compatibilidad completa con las API, lo que marca un importante hito en el campo de la tecnología de inteligencia artificial de código abierto.
Mejoras técnicas y posicionamiento del mercado
El DeepSeek-V3.1 se lanzó solo cinco meses después de la versión anterior, DeepSeek-V3-0324. La versión V3-0324 fue lanzada en marzo de este año y logró mejoras notables en indicadores clave como la capacidad de razonamiento, la eficiencia de programación y los cálculos matemáticos, lo que proporcionó una base sólida para la optimización posterior en la versión V3.1.
Bajo el creciente entorno competitivo global en tecnología de inteligencia artificial, la rápida estrategia de actualización de productos de DeepSeek demuestra claramente su capacidad de innovación tecnológica y velocidad de respuesta al mercado. A pesar de las restricciones impuestas por sanciones internacionales sobre el acceso a recursos de cálculo de alto nivel, DeepSeek sigue manteniendo una ventaja competitiva sólida en el campo de modelos de lenguaje a gran escala de código abierto mediante métodos de entrenamiento eficientes y estrategias de optimización innovadoras.
Características técnicas principales
Capacidad ampliada para procesar contexto: La mejora principal en la versión V3.1 es el doble de la capacidad de la ventana de contexto, lo que permite al modelo manejar secuencias más largas de diálogos múltiples y tareas de consulta complejas, ofreciendo así una experiencia de interacción más coherente y profunda a los usuarios.
Optimización de la estructura de salida: Según los comentarios de usuarios iniciales, el V3.1 ha realizado importantes mejoras en el estilo de expresión lingüística; ahora el modelo tiende a generar contenido con una estructura definida, incluyendo datos formateados como tablas y listas, mejorando así la legibilidad y utilidad de la información.
Capacidad mejorada para comprender física: En la nueva versión, se observa una mejora notable en la simulación de fenómenos físicos y la comprensión de conceptos relacionados, lo que brinda un mayor respaldo para aplicaciones en cálculos científicos e ingeniería.
Arquitectura continua y optimizada: El V3.1 continúa utilizando el diseño de arquitectura de "Mezcla de Expertos" (MoE, Mixture of Experts) ya probado, y está especialmente optimizado para tareas de razonamiento habitual; en dichos escenarios no es necesario activar el modo "DeepThink" de pensamiento profundo, garantizando así la eficiencia de procesamiento y la calidad de la salida.
Implementación y compatibilidad
El DeepSeek-V3.1 ya está disponible en varios plataformas, incluyendo el sitio web oficial de DeepSeek, aplicaciones móviles y miniaplicaciones de WeChat, entre otros canales principales de acceso para los usuarios. La empresa destacó especialmente la compatibilidad total con las API, asegurando que los usuarios y desarrolladores existentes puedan migrar sin problemas a la nueva versión sin necesidad de modificar el código de integración o el método de invocación existente.
Compromiso con el código abierto y planificación futura
Aunque hasta la fecha Hugging Face aún no ofrece archivos de pesos del modelo V3.1 para descarga, DeepSeek reafirmó su compromiso a largo plazo con la comunidad de código abierto, prometiendo continuar con su estrategia de lanzamientos de código abierto y proporcionar apoyo técnico a la comunidad global de investigación en inteligencia artificial y a los desarrolladores.