Microsoft a officiellement publié en open source sur son site web une version améliorée de DeepSeek-R1 : MAI-DS-R1. Ce nouveau modèle conserve les performances d'inférence du modèle original tout en bénéficiant d'améliorations significatives, notamment en ce qui concerne la capacité de réponse aux sujets sensibles.

QQ_1744964448252.png

MAI-DS-R1 affiche un taux de réponse de 99,3 %, plus du double de la version originale R1. Cette avancée apportera un soutien considérable à la recherche en sciences politiques, aux études des problèmes sociaux et à l'éthique. Bien qu'il réponde à davantage de sujets sensibles, le niveau de contenu préjudiciable de MAI-DS-R1 a été réduit de 50 %, démontrant une bonne maîtrise des risques de sécurité. Par conséquent, les utilisateurs désireux d'une expérience plus « libérée » peuvent essayer ce modèle et explorer de nouvelles possibilités.

QQ_1744964462119.png

Lors de l'entraînement du modèle, Microsoft a collecté environ 350 000 exemples de sujets censurés et a sélectionné les mots clés de recherche associés. Ces mots clés ont été transformés en plusieurs questions et traduits dans différentes langues, améliorant ainsi l'adaptabilité multilingue du modèle. De plus, Microsoft a utilisé DeepSeek R1 et des modèles internes pour générer des réponses et des chaînes de raisonnement aux questions. Les données d'entraînement incluaient également 110 000 exemples de sécurité et de violations provenant du jeu de données Tulu3SFT, garantissant l'efficacité du modèle dans diverses situations.

Après une évaluation complète, MAI-DS-R1 a démontré d'excellentes performances en matière de réponse aux sujets sensibles, surpassant largement DeepSeek R1 et ses versions dérivées. Dans l'évaluation de la sécurité, MAI-DS-R1 a obtenu de bons résultats au test HarmBench, montrant sa capacité à réduire efficacement le contenu préjudiciable, assurant ainsi un bon équilibre entre sécurité et capacité de réponse.

En termes de capacité d'inférence, MAI-DS-R1 est comparable à DeepSeek R1, affichant d'excellents résultats aux tests de référence sur le bon sens, le raisonnement, les mathématiques et la programmation. Simultanément, le modèle fait preuve d'une plus grande prudence dans le traitement des requêtes illégales ou immorales, refusant de générer tout contenu préjudiciable ou inapproprié.

De plus, lors de l'entraînement ultérieur, les questions ont été traduites en plusieurs langues, permettant à MAI-DS-R1 de mieux répondre aux besoins des organisations internationales, des entreprises multinationales et des établissements d'enseignement dans des contextes multilingues. Microsoft a publié ce modèle en open source sur Hugging Face et sur Azure AI Foundry, offrant ainsi un plus large choix aux utilisateurs.

Hugging Face : https://huggingface.co/microsoft/MAI-DS-R1

Azure : https://ai.azure.com/explore/models/MAI-DS-R1/version/1/registry/azureml

Points clés :

🌟 La capacité de réponse de MAI-DS-R1 aux sujets sensibles a été améliorée à 99,3 %, soit plus du double de la version originale R1.

🔒 Les risques de sécurité ont été considérablement réduits, le contenu préjudiciable diminuant de 50 %, garantissant ainsi une utilisation sûre.

🌍 Forte capacité de prise en charge multilingue, mieux adaptée aux besoins des organisations internationales et des entreprises multinationales.