En un destacado torneo internacional de ajedrez con inteligencia artificial, el modelo o3 de OpenAI mostró una ventaja abrumadora, obteniendo la victoria con un récord invicto. Este partido tenía una regla especial: los modelos de inteligencia artificial participantes debían competir sin haber recibido ningún entrenamiento específico en ajedrez, pudiendo obtener solo conocimientos básicos sobre el ajedrez a través de Internet antes del torneo.

En la fase final, o3 enfrentó a Grok4 de xAI y ganó con un marcador abrumador de 4-0. Lo más impresionante fue que o3 mantuvo un registro perfecto durante todo el torneo, ganando tres partidas con un marcador de 4-0, incluso derrotando al modelo o4mini de OpenAI en las semifinales.

Grok4 también mostró un buen desempeño en su camino hacia la final, venciendo consecutivamente a dos fuertes rivales de Google: Gemini2.5Flash y Gemini2.5Pro. En ese momento, Elon Musk expresó confianza al afirmar que el equipo de xAI "no había invertido mucho tiempo en el ajedrez", sugiriendo que la fuerza natural de Grok4 era suficiente.

image.png

Sin embargo, el resultado de la final sorprendió a muchos observadores. El editor jefe de Chess.com, Pedro Pinhata, escribió en su informe posterior: "Hasta las semifinales, parecía que no había nada que pudiera detener a Grok4 para ganar. Pero esa ilusión se rompió el último día del partido".

El maestro de ajedrez Nakamura, quien actuó como comentarista, dijo claramente en vivo: "Grok cometió muchos errores durante el partido, pero OpenAI no lo hizo". Esta evaluación simple reveló la clave del resultado.

Más interesante aún fue el comentario del campeón número uno del mundo, Magnus Carlsen. Dijo que el nivel de habilidad de los dos modelos de inteligencia artificial en la final era aproximadamente equivalente a un jugador promedio que apenas había aprendido las reglas, con una calificación ELO de alrededor de 800 puntos. Como comparación, la calificación ELO de Carlsen es de 2839 puntos, y el segundo lugar, Nakamura, tiene 2807 puntos; la diferencia entre ambos es inmensa.

image.png

Carlsen analizó más a fondo las limitaciones de estos modelos de inteligencia artificial general en el ajedrez. Descubrió que el rendimiento de estos modelos era muy inestable, con buenas y malas jugadas alternadas. Aunque podían calcular bien el intercambio de piezas, tenían dificultades para dar jaque mate, que es el objetivo principal del juego. "Entienden la ventaja material, pero no saben cómo ganar", dijo Carlsen con una metáfora, "es como ser bueno recolectando ingredientes, pero no sabiendo cocinarlos".

Este resultado contrasta claramente con los programas de inteligencia artificial diseñados específicamente para el ajedrez. Recordemos que, en 1997, la supercomputadora "Deep Blue" derrotó al campeón mundial de ajedrez Garry Kasparov, y en 2016, AlphaGo venció al gran maestro surcoreano Lee Sedol. Estos programas estaban especialmente diseñados para juegos de estrategia, con conocimientos profundos y entrenamientos especializados.

image.png

De hecho, la limitación de los modelos de inteligencia artificial general en áreas profesionales de ajedrez ya ha sido evidente con anterioridad. A principios de este año, en otro torneo organizado por el maestro de ajedrez Levy Rozman, tanto Grok como ChatGPT perdieron contra el sistema de inteligencia artificial Stockfish, diseñado específicamente para el ajedrez, confirmando nuevamente la brecha de poder entre los modelos generales y los sistemas especializados.