Dans la compétition des grands modèles qui s'intensifie aujourd'hui, DeepSeek-R1, grâce à ses capacités exceptionnelles en programmation, a surpassé Claude Opus4, surnommé « le modèle de codage le plus puissant au monde », pour devenir le nouveau champion dans le domaine du codage web. Bien que cette nouvelle version de DeepSeek semble être une simple mise à jour mineure, elle affiche des performances similaires à celles d’OpenAI’s o3-high sur LiveCodeBench, suscitant de nombreuses discussions passionnées sur sa capacité parmi les utilisateurs.
Pour lever le voile sur le mystère entourant DeepSeek-R1, nous avons effectué plusieurs tests pratiques pour voir à quel point ce modèle est puissant. Tout d'abord, nous lui avons demandé de créer une application animée du système solaire. En seulement 49 secondes de réflexion, il a fourni un code Python qui, après exécution dans VS Code, a réussi à afficher une animation fonctionnelle, bien que la page soit légèrement grossière, mais possédant déjà des effets d'animation de base. Par la suite, nous avons tenté de simuler le système solaire avec Three.js. DeepSeek-R1 a clarifié les idées en seulement 34 secondes et peut être exécuté directement en un clic, avec des résultats atteignant des standards « de prochaine génération ».
Source d'image : Image générée par IA, fournisseur d'autorisation d'image Midjourney
Ensuite, nous avons testé DeepSeek-R1 pour générer une page web sur l'intelligence artificielle générale (IAA). Après 23 secondes de réflexion, il a fourni un code HTML comprenant trois sections : « Partage des connaissances », « Communauté » et « Création future », tout en ayant également la fonctionnalité de lancement immédiat. La conception était moderne et pleine de technologie, reflétant l'esprit novateur de l'IAA.
Cependant, dans la tâche de créer un jeu de Tetris, DeepSeek-R1 a rencontré des difficultés. Bien qu'il ait fourni un code Python en 12 secondes, des bugs étaient évidents dans le jeu, notamment l'absence de boutons interactifs. Après plusieurs essais de correction, les résultats restaient insatisfaisants.
En tant que modèle open source, DeepSeek-R1 montre des progrès significatifs en termes de capacité de programmation, mais reste encore à améliorer. Il convient de noter que, comparé aux modèles Claude, il est plus accessible et gratuit pour les utilisateurs chinois. De plus, DeepSeek-R1 a été classé comme le meilleur modèle de texte open source actuel, se classant sixième au classement général, avec des performances impressionnantes dans plusieurs domaines spécifiques.