La nuit dernière, la plateforme open source de modèles larges bien connue, DeepSeek, a publié sa dernière version R1 (0528), attirant une attention considérable. Cette publication n'a pas été accompagnée d'une description détaillée, et DeepSeek a choisi de rendre le modèle disponible de manière "discrète", en prévoyant de publier ultérieurement une fiche du modèle pour présenter ses fonctionnalités plus en détail.
Il est rapporté que les résultats des tests sur la célèbre plateforme d'évaluation de code Live CodeBench montrent que la performance de la version R1-0528 est comparable à celle du dernier modèle o3 d'OpenAI. De nombreux internautes ont exprimé leur attente face à cette nouvelle version, et après l'avoir testée, ils ont constaté que la nouvelle version R1 présente un style et des performances similaires à celles du modèle o3 d'OpenAI.
En termes spécifiques, dans les réponses en style professionnel, R1-0528 montre des caractéristiques proches de celles de o3-2.5. Que ce soit dans la manière d'utiliser les flèches et les astérisques ou dans la formulation de "pourquoi cela fonctionne" à la fin, R1 affiche une grande persuasivité. Bien que OpenAI continue d'améliorer constamment les performances de ses modèles, DeepSeek reste performant avec R1, suscitant une grande attente pour la version suivante R2.
Le cofondateur et PDG de Hyperbolic Labs a également souligné que R1 reste un modèle capable de répondre précisément à la question "laquelle est plus grande : 9.9 ou 9.11". Cette capacité reflète son haut niveau de performance intellectuelle. Par ailleurs, l'expert en intelligence artificielle Haider a également loué la nouvelle version R1, mentionnant qu'il avait réussi à construire un système de notation de mots lors d'un défi de programmation, fournissant du code propre et des exemples de tests exécutable, passant parfaitement au premier essai.
Haider a noté que précédemment, seul le modèle o3 pouvait accomplir de telles tâches, mais maintenant, R1 de DeepSeek atteint également ce niveau. Il a ajouté que bien que le temps de réflexion du modèle semble s'être allongé, son niveau d'intelligence est impressionnant. À mesure que les tests se poursuivent, on se demande si DeepSeek ne prévoit pas intentionnellement cette version R1 comme une transition pour éviter tout éventuel désappointement lié à la future version R2.
La nouvelle version de DeepSeek R1 s'en sort bien non seulement en corrigeant les chaînes de raisonnement comme le fait o3, mais elle possède aussi une capacité créative similaire à celle de Claude, une fonctionnalité absente dans les versions précédentes. Avec la publication de la fiche du modèle officielle, la communauté ouverte AIGC apportera une analyse plus approfondie, espérant de nombreuses autres surprises à venir.
Adresse open-source : https://huggingface.co/deepseek-ai/DeepSeek-R1-0528/tree/main
Points clés :
🌟 Nouvelle version open source de DeepSeek R1 (0528), performances comparables à celles du modèle o3 d'OpenAI.
💻 Les tests montrent que R1 excelle en programmation, réussissant des tâches complexes.
🔍 Attendez-vous à la publication d'une fiche du modèle par DeepSeek pour une analyse approfondie des fonctionnalités de la nouvelle version.