Récemment, DeepMind de Google a annoncé que son modèle d'IA le plus puissant, Gemini 2.5 Deep Think, est désormais accessible aux abonnés Google AI Ultra. Ce modèle a remporté une médaille d'or lors du Championnat international de mathématiques (IMO) en 2025, et grâce à sa technologie innovante de « pensée parallèle » et d'apprentissage renforcé, il a montré des performances impressionnantes dans plusieurs domaines.
Gemini 2.5 Deep Think : le sommet de la capacité d'inférence de l'IA
Le modèle Gemini 2.5 Deep Think est le plus avancé de la série Gemini 2.5, conçu pour traiter des tâches complexes. Son point fort réside dans l'introduction de la « pensée parallèle » (Parallel Thinking) et d'une nouvelle technique d'apprentissage renforcé, permettant au modèle de simuler le processus de brainstorming humain, d'explorer plusieurs chemins d'inférence et de les comparer, pour finalement produire des réponses plus précises et plus créatives. Par rapport aux modèles d'IA traditionnels qui raisonnent de manière linéaire, cette capacité rend Deep Think particulièrement performant dans la résolution de problèmes complexes.
Principales avancées techniques :
1. Mécanisme de pensée parallèle : Deep Think utilise un système d'agents multiples, permettant à plusieurs « agents » d'IA de traiter un problème simultanément, d'explorer différentes hypothèses et d'intégrer les résultats. Cette approche améliore non seulement la profondeur de l'inférence, mais aussi considérablement la capacité à résoudre des tâches complexes comme les mathématiques, les sciences et le codage.
2. Optimisation par apprentissage renforcé : Google a développé une nouvelle technique d'apprentissage renforcé, encourageant le modèle à améliorer continuellement ses stratégies pendant le raisonnement. Cela rend Deep Think plus efficace pour traiter des tâches nécessitant une amélioration progressive (comme la conception d'algorithmes ou la planification stratégique).
3. Prise en charge multimodale et contexte long : Gemini 2.5 Deep Think prend en charge les entrées textuelles, audio, images et vidéos, avec une fenêtre de contexte de 1 million de tokens, permettant de traiter de grands ensembles de données. Il convient à divers scénarios allant de la recherche académique à des applications en temps réel.
Certification IMO : une étape majeure dans les mathématiques et l'inférence
Dans le Championnat international de mathématiques (IMO) en 2025, une version spécialement optimisée de Gemini 2.5 Deep Think a obtenu une médaille d'or avec 35 points sur 42, démontrant sa force exceptionnelle dans le domaine de l'inférence mathématique. Selon le président de l'IMO, le professeur Gregor Dolinar, les solutions proposées par Deep Think sont « claires, précises et, dans de nombreux cas, plus faciles à comprendre que celles des participants humains ».
Les avancées dans les domaines des mathématiques et des sciences :
- Deep Think a réussi à résoudre cinq des six problèmes du concours IMO, prouvant sa capacité exceptionnelle à gérer des problèmes mathématiques complexes.
- Contrairement aux modèles AlphaProof et AlphaGeometry2 de l'année précédente (qui ont obtenu une médaille d'argent), Deep Think utilise uniquement le traitement naturel du langage, éliminant ainsi la dépendance à un langage spécifique à un domaine, ce qui rend son raisonnement plus général et plus flexible.
- La version publique de Deep Think, bien qu'optimisée pour une utilisation quotidienne, peut atteindre un niveau de médaille de bronze lors des tests de référence IMO, tout en maintenant un équilibre entre performance et utilité.
Performances remarquables sur les benchmarks : codage et connaissances interdisciplinaires
Gemini 2.5 Deep Think s'est distingué dans plusieurs benchmarks officiels, consolidant sa position de leader dans le domaine de l'IA :
- LiveCodeBench V6 : dans ce benchmark de codage compétitif, Deep Think a obtenu un score de 87,6 %, surpassant Grok4 de xAI (79 %) et o3 d'OpenAI (72 %), démontrant ainsi sa forte capacité à traiter des tâches de programmation complexes.
- Humanity’s Last Exam (HLE) : ce test complet couvrant les mathématiques, les sciences et les humanités contient environ 3 000 questions expertes. Deep Think a obtenu un score de 34,8 %, se classant en tête, loin devant Grok4 (25,4 %) et o3 (20,3 %).
- WebDev Arena et LMArena : Deep Think s'est distingué dans les domaines du développement web et de l'aide à l'apprentissage, devenant un leader dans ces classements.
Ces résultats montrent que Deep Think n'est pas seulement doué pour les mathématiques et le codage, mais qu'il peut également traiter des problèmes complexes à travers plusieurs domaines, offrant ainsi un outil puissant aux chercheurs et développeurs.
Accessibilité pour les utilisateurs : exclusivement aux abonnés du programme Google AI Ultra
Gemini 2.5 Deep Think est désormais accessible via l'application Gemini (iOS et Android) aux abonnés du programme Google AI Ultra, au prix mensuel de 249,99 dollars (124,99 dollars pour les nouveaux utilisateurs pendant les trois premiers mois). Les utilisateurs peuvent utiliser un nombre fixe de prompts Deep Think par jour, et le modèle intègre automatiquement des outils comme l'exécution de code et la recherche Google pour générer des réponses plus détaillées.
Google prévoit également, au cours des prochaines semaines, de proposer aux testeurs fiables (y compris des mathématiciens et des développeurs) des versions de Deep Think avec et sans outils via l'API Gemini, afin d'explorer davantage son potentiel d'application dans les scénarios professionnels et de développement.
Impact industriel et perspective future
La sortie de Gemini 2.5 Deep Think marque un nouveau bond en avant dans la capacité d'inférence de l'IA. L'application de sa technologie de « pensée parallèle » et d'apprentissage renforcé n'améliore pas seulement les performances du modèle dans les tâches académiques et de codage, mais ouvre également de nouvelles possibilités pour les tâches créatives (comme l'optimisation de design ou la planification stratégique). DeepMind de Google affirme que Deep Think continuera à évoluer, visant un score parfait à l'IMO et s'étendant à davantage de domaines.
Point de vue d'AIbase : le lancement de Gemini 2.5 Deep Think indique que l'industrie de l'IA s'oriente vers une inférence et une créativité plus approfondies, au-delà de simples reconnaissances de motifs. Toutefois, les coûts d'abonnement élevés et les exigences en ressources informatiques pourraient limiter sa diffusion. À l'avenir, comment Google parviendra-t-il à équilibrer performance, coût et accessibilité, déterminera si Deep Think deviendra véritablement un « changement de jeu » dans le domaine de l'IA.
Conclusion