Le 6 août 2025, la première compétition internationale de jeu d'échecs d'intelligence artificielle organisée par DeepMind de Google et Kaggle a atteint la phase des demi-finales sur la plateforme Kaggle Game Arena. Cette compétition rassemble les modèles d'IA les plus performants du monde, se déroulant par échanges en texte pur selon un système de tournoi à élimination directe, dans le but d'évaluer les capacités des grands modèles en matière de prise de décision complexe et de raisonnement logique.

Dans les deux matchs phares des demi-finales, Grok4 d'xAI a étonnamment battu Gemini 2.5 Pro de Google, tandis qu'O3 d'OpenAI a remporté la victoire contre son frère O4-mini lors d'une "guerre civile", suscitant une grande attention.

Grok4 étrille Gemini 2.5 Pro

Dans le premier match des demi-finales, Grok4 d'xAI affrontait le modèle phare de Google, Gemini 2.5 Pro. Ce match était considéré comme un duel entre les meilleures approches technologiques, avec Gemini 2.5 Pro vu comme le favori pour la victoire en raison de sa puissante vision tactique et de sa performance stable. Cependant, Grok4 a remporté le match avec un score écrasant de 4 à 0, démontrant une capacité impressionnante à analyser les stratégies.

Pendant le match, Grok4 a montré un jeu solide dès le début, maîtrisant précisément la situation sur l'échiquier, et plusieurs fois grâce à des dispositions tactiques ingénieuses, il a forcé Gemini 2.5 Pro à prendre une position défensive. Bien que Gemini 2.5 Pro ait gagné contre Claude Opus 4 d'Anthropic avec un score de 4 à 0 lors du premier tour, montrant un bon niveau de jeu, cette fois-ci, ses analyses semblaient trop longues, ne parvenant pas à s'adapter au rythme d'attaque de son adversaire. Grok4, quant à lui, grâce à une réflexion efficace et une compréhension profonde de la partie, a réussi des percées tactiques critiques à des moments cruciaux, scellant ainsi sa victoire.

Après la rencontre, les réseaux sociaux ont été très réactifs face aux performances de Grok4. Les analystes estiment que la capacité de Grok4 à s'adapter rapidement aux jeux dynamiques et à prendre des décisions précises pourrait être la clé de sa victoire. Cette victoire a fait de Grok4 un candidat fort pour la finale, suscitant beaucoup d'espoirs.

QQ20250807-090739.png

O3 bat O4-mini, la guerre civile d'OpenAI se termine

Dans l'autre demi-finale, O3 d'OpenAI et O4-mini ont disputé un combat spectaculaire « en interne ». O3 a battu O4-mini avec un score de 4 à 0, se qualifiant ainsi pour la finale. Le match a été court et globalement calme, avec O3 montrant une stabilité et une maîtrise du jeu supérieures.

O4-mini avait déjà battu DeepSeek R1 avec un score de 4 à 0 lors du premier tour, démontrant un bon niveau de jeu, notamment avec deux cas de « mat » qui ont attiré l'attention. Cependant, lorsqu'il a affronté O3, bien que l'ouverture ait eu quelques points forts, les erreurs de jugement au milieu de la partie ont progressivement fait perdre à O4-mini l'avantage. O3, quant à lui, grâce à une réflexion plus efficace et une bonne maîtrise de la partie, a avancé lentement mais sûrement, finalement scellant sa victoire.

Il convient de noter que durant ce match, aucune erreur grave n'a été commise par les deux parties, et la qualité de la partie était élevée, reflétant la solide expertise d'OpenAI en matière de raisonnement stratégique d'échecs. La victoire d'O3 renforce davantage sa compétitivité dans le domaine des échecs d'intelligence artificielle.

Contexte et perspectives de la compétition

Cette compétition d'échecs d'intelligence artificielle vise à tester les capacités de raisonnement logique et de stratégie des grands modèles via des combats dynamiques. Les modèles participants incluent la série Gemini de Google, O3 et O4-mini d'OpenAI, Claude Opus 4 d'Anthropic, R1 de DeepSeek et K2 de Kimi. L'ensemble de la compétition interdit l'utilisation d'outils externes tels que le moteur Stockfish, se basant uniquement sur la capacité de l'IA à effectuer des calculs en temps réel. Les résultats des demi-finales montrent que Grok4 et O3 affronteront bientôt leur confrontation finale, où sera désigné le champion de la première compétition internationale d'échecs d'intelligence artificielle.