A primera hora de la madrugada, la conocida plataforma de modelos open source DeepSeek lanzó su nueva versión R1 (0528), lo que ha generado gran interés. Esta publicación no incluyó una explicación detallada; DeepSeek optó por "abrir" el modelo de manera silenciosa, esperando publicar más tarde un "modelo card" para proporcionar una descripción más completa de sus funciones.

Según se informa, los resultados de las pruebas del rendimiento del nuevo modelo R1-0528 en la famosa plataforma de prueba de código Live CodeBench mostraron un rendimiento comparable al del último modelo o3 de OpenAI. Muchos usuarios expresaron su entusiasmo y realizaron diversas pruebas, notando que la nueva versión R1 muestra un estilo y desempeño similar al modelo o3 de OpenAI.

Específicamente, en cuanto a la respuesta en estilos profesionales, R1-0528 exhibió características similares al o3-2.5. Ya sea en la forma en que utiliza flechas y asteriscos, o en la expresión final "por qué funciona", R1 demostró una alta capacidad de persuasión. Aunque OpenAI sigue trabajando arduamente para mejorar el rendimiento de sus modelos, el R1 de DeepSeek continúa destacándose y generando expectativas sobre su próxima versión R2.

image.png

El cofundador y director ejecutivo de Hyperbolic Labs también señaló que el R1 sigue siendo un modelo capaz de responder con precisión a preguntas como "¿Cuál es mayor, 9.9 o 9.11?". Esta habilidad subraya su alto nivel de inteligencia. Además, el renombrado comentarista de IA Haider elogió encarecidamente la nueva versión R1, mencionando que durante un desafío de programación, R1 logró construir un sistema de puntuación de palabras, proporcionando un código limpio y casos de prueba funcionales que pasaron perfectamente en su primera ejecución.

Haider señaló que anteriormente solo el modelo o3 podía realizar tareas tan complejas, pero ahora el R1 de DeepSeek también alcanzó ese nivel. A pesar de que el tiempo de procesamiento parece haber aumentado, su nivel de inteligencia es sorprendente. Conforme avanzan las pruebas, no puede evitarse pensar si DeepSeek está deliberadamente lanzando esta versión R1 como una transición para evitar decepcionar a los usuarios con el futuro lanzamiento del R2.

La nueva versión DeepSeek R1 muestra un buen desempeño, no solo realizando correcciones de cadenas de razonamiento como el o3, sino también mostrando capacidades creativas similares a las de Claude, algo que las versiones anteriores no poseían. Con la publicación oficial del "modelo card", la comunidad abierta de AIGC ofrecerá un análisis más profundo sobre las nuevas funciones, esperando muchas sorpresas futuras.

Dirección del proyecto open source: https://huggingface.co/deepseek-ai/DeepSeek-R1-0528/tree/main

Lo más importante:

🌟 La nueva versión DeepSeek R1 (0528) está disponible como open source, con un rendimiento equiparable al modelo o3 de OpenAI.

💻 Las pruebas muestran que R1 se desempeña bien en habilidades de programación, completando tareas complejas con éxito.

🔍 Esperamos que DeepSeek publique pronto el "modelo card" para analizar en detalle las funciones de la nueva versión.