Microsoft ha lanzado oficialmente en código abierto en su sitio web una versión modificada de DeepSeek-R1: MAI-DS-R1. Este nuevo modelo, además de mantener el rendimiento de inferencia original, ha experimentado mejoras significativas, especialmente en su capacidad de respuesta a temas delicados, logrando un gran avance.

QQ_1744964448252.png

MAI-DS-R1 alcanza una capacidad de respuesta del 99.3%, más del doble que la versión original R1. Este progreso brindará un gran apoyo a la investigación en ciencias políticas, problemas sociales y ética. A pesar de responder a más temas delicados, MAI-DS-R1 ha reducido el contenido dañino en un 50%, mostrando un buen control de seguridad. Por lo tanto, los usuarios que deseen experimentar una versión más "libre" pueden probar este modelo y explorar nuevas posibilidades.

QQ_1744964462119.png

Durante el entrenamiento del modelo, Microsoft recopiló aproximadamente 350.000 ejemplos de temas bloqueados y seleccionó las palabras clave relevantes. Estas palabras clave se convirtieron en múltiples preguntas y se tradujeron a diferentes idiomas, mejorando aún más la adaptabilidad multilingüe del modelo. Además, Microsoft utilizó DeepSeek R1 y modelos internos para generar respuestas y cadenas de pensamiento a preguntas relacionadas. Los datos de entrenamiento también incluyeron 110.000 ejemplos de seguridad y violaciones del conjunto de datos Tulu3SFT, asegurando la eficacia del modelo en diversas situaciones.

Tras una evaluación exhaustiva, MAI-DS-R1 muestra un rendimiento excepcional en la capacidad de respuesta a temas delicados, superando con creces a DeepSeek R1 y sus versiones derivadas. En la evaluación de seguridad, MAI-DS-R1 obtuvo buenos resultados en la prueba HarmBench, demostrando su capacidad para reducir eficazmente el contenido dañino y asegurar un buen equilibrio entre seguridad y capacidad de respuesta.

En cuanto a la capacidad de razonamiento, MAI-DS-R1 se mantiene a la par de DeepSeek R1, mostrando un rendimiento excelente en pruebas de referencia de conocimiento general, razonamiento, matemáticas y programación. Al mismo tiempo, el modelo es más cauteloso al manejar solicitudes ilegales o inmorales, negándose a generar cualquier contenido dañino o inapropiado.

Además, en el entrenamiento posterior, MAI-DS-R1 traduce las preguntas a varios idiomas, lo que le permite satisfacer mejor las necesidades de organizaciones internacionales, empresas multinacionales e instituciones educativas en entornos multilingües. Microsoft ya ha lanzado este modelo en código abierto en huggingface y en Azure AI Foundry, ofreciendo más opciones a los usuarios.

huggingface:https://huggingface.co/microsoft/MAI-DS-R1

Azure address:https://ai.azure.com/explore/models/MAI-DS-R1/version/1/registry/azureml

Puntos clave:

🌟 La capacidad de respuesta de MAI-DS-R1 a temas delicados ha aumentado al 99.3%, más del doble que la versión original R1.

🔒 El riesgo de seguridad se ha reducido significativamente, con una disminución del 50% en el contenido dañino, garantizando un uso seguro.

🌍 Admite múltiples idiomas, adaptándose mejor a las necesidades de organizaciones internacionales y empresas multinacionales.