En una impresionante batalla de Pokémon, la nueva estrella de la IA, GPT-5, logró superar con éxito el juego clásico "Pokémon Crystal" con un récord de 9517 pasos, derrotando al oponente final del juego, Red. Esta batalla hizo que el directo se volviera loco, y los espectadores comenzaron a escribir en el chat "GG" (Good Game), lo que también llevó la eficiencia de GPT-5 a un nuevo nivel.
Según los datos del bloguero de Twitter Clad3815, el número de pasos que tomó a GPT-5 completar el juego es mucho menor que los 27040 pasos de su predecesor o3, que era casi tres veces mayor. Esto significa que GPT-5 solo necesitó 202 horas para completar este desafío, mientras que o3 necesitó casi un mes. Obviamente, la velocidad de la IA es asombrosa.

En el juego, los jugadores deben salir de un pueblo, recolectar medallas, desafiar a los entrenadores de gimnasio y finalmente enfrentarse a Red. GPT-5, como Ash, avanzó por la trama principal, recolectando todas las 16 medallas en solo 9205 pasos, mientras que o3 tardó 22334 pasos. Lo más sorprendente es que, desde que recolectó todas las medallas hasta vencer a Red, GPT-5 solo necesitó 312 pasos, mientras que o3 gastó casi 5000 pasos, lo que aumentó su eficiencia varias veces.
En los desafíos de los cuatro grandes y el campeón, GPT-5 también mostró una alta eficiencia, usando solo 7329 pasos, mientras que o3 usó más de 18000 pasos. Destacablemente, antes de completar "Pokémon Crystal", GPT-5 también logró superar con éxito "Pokémon Rojo", obteniendo una victoria abrumadora.
El co-fundador de OpenAI, Greg Brockman, también elogió este desempeño. El rendimiento de GPT-5 en esta batalla de Pokémon fue notable. ¿Qué hace que GPT-5 sea tan eficiente? Clad3815 resumió varios factores clave:
1. 👁️ Menos ilusiones, más rapidez: La aparición de "ilusiones" durante el juego de GPT-5 disminuyó significativamente, mejorando enormemente su velocidad.
2. 🧠 Mejor razonamiento espacial: En áreas complejas, GPT-5 casi no se pierde, pudiendo planificar secuencias de acción eficientemente, ahorrando mucho tiempo.
3. 🎯 Planificación de objetivos superior: En cuanto a la ejecución de objetivos y la planificación de tareas, GPT-5 demostró una capacidad excepcional.
Curiosamente, "Pokémon" es considerado un "nuevo estándar" para evaluar la capacidad de la IA, proporcionando una plataforma de prueba para la capacidad de toma de decisiones, comprensión del contexto y control de interfaz de los modelos de lenguaje grandes. Sin embargo, desafiar este juego tiene un costo elevado, estimado en aproximadamente 3500 dólares (alrededor de 25.000 yuanes) en cuotas de API por parte de un usuario cuando GPT-5 completó "Pokémon Rojo".





