Em um campeonato internacional de xadrez com inteligência artificial altamente aguardado, o modelo o3 da OpenAI demonstrou uma vantagem dominante, conquistando o título com uma vitória total. Este jogo tinha uma regra especial: os modelos de inteligência artificial participantes deveriam competir sem qualquer treinamento específico em xadrez, podendo apenas obter conhecimentos básicos de xadrez na internet antes do torneio.

Na fase final, o o3 enfrentou o Grok4 da xAI e venceu por um placar de 4-0, com uma vitória clara. O mais impressionante é que o o3 manteve um histórico perfeito durante todo o campeonato, vencendo três jogos por 4-0, incluindo a vitória por 4-0 na semifinal contra o modelo o4mini, também desenvolvido pela OpenAI.

O Grok4 também teve um desempenho notável no caminho para a final, derrotando consecutivamente dois fortes adversários da Google - Gemini2.5Flash e Gemini2.5Pro. Na época, Elon Musk expressou confiança ao dizer que a equipe da xAI "não se dedicou muito ao xadrez", sugerindo a força natural do Grok4.

image.png

No entanto, o resultado da final surpreendeu muitos observadores. O editor-chefe da Chess.com, Pedro Pinhata, escreveu em seu relato pós-jogo: "Até as semifinais, parecia que nada poderia impedir o Grok4 de vencer. Mas essa ilusão foi destruída no último dia do jogo."

O mestre de xadrez Kenichiro Komatsu, convidado como comentarista, falou abertamente durante o vivo: "O Grok cometeu muitos erros durante o jogo, mas a OpenAI não." Essa avaliação concisa revelou a chave da vitória.

O interessante é a opinião do mestre de xadrez número um do mundo, Magnus Carlsen. Ele disse que o nível de habilidade dos dois modelos de IA na final era equivalente ao de um jogador comum que acabou de aprender as regras, com uma pontuação ELO de aproximadamente 800 pontos. Como comparação, a pontuação ELO de Carlsen é de 2839 pontos, e o segundo colocado, Kenichiro Komatsu, tem 2807 pontos; a diferença entre eles é imensa.

image.png

Carlsen analisou ainda mais as limitações desses modelos de IA gerais no xadrez. Ele descobriu que o desempenho desses modelos é extremamente instável, com altos e baixos em sua habilidade de xadrez. Eles se saem bem na computação de capturas de peças, mas têm dificuldade em atingir o objetivo principal de dar xeque-mate. "Eles entendem vantagem material, mas não sabem como vencer", comparou Carlsen de forma criativa, "é como ser bom em coletar ingredientes, mas não saber cozinhar".

O resultado deste jogo contrasta fortemente com os sistemas de IA especializados em xadrez. A recordação histórica mostra que supercomputadores como o Deep Blue, que venceu o mestre de xadrez Garry Kasparov em 1997, e o AlphaGo, que venceu o profissional sul-coreano Lee Sedol em 2016, foram programados especialmente para jogos de tabuleiro, possuindo conhecimento profundo e treinamento especializado.

image.png

De fato, as limitações dos modelos de IA gerais em áreas profissionais de xadrez já tiveram precedentes. No início deste ano, em outro campeonato organizado pelo mestre de xadrez Levy Rozman, tanto o Grok quanto o ChatGPT perderam para o sistema de inteligência artificial Stockfish, projetado especificamente para xadrez, reforçando ainda mais a diferença de força entre modelos gerais e sistemas especializados.