ARC-AGI est un ensemble de données conçu pour tester la capacité des systèmes d'intelligence artificielle à réaliser des tâches d'abstraction et de raisonnement similaires à celles de l'intelligence fluide humaine. Il se compose de 400 tâches d'entraînement et de 400 tâches d'évaluation, chacune stockée au format JSON et incluant des paires entrée-sortie. Cet ensemble de données peut servir de benchmark pour l'intelligence artificielle, de benchmark pour la synthèse de programmes ou de test psychométrique d'intelligence.