Este repositorio de GitHub contiene el código de entrenamiento e inferencia para reproducir nuestra solución ganadora en el premio de progreso de la Olimpiada Internacional de Matemáticas con IA (AIMO). Nuestra solución se compone de cuatro partes principales: una receta para afinar DeepSeekMath-Base 7B para resolver problemas matemáticos mediante la integración de razonamiento con herramientas (TIR); dos conjuntos de datos de entrenamiento de alta calidad con aproximadamente 1 millón de problemas y soluciones matemáticas; un algoritmo de decodificación autoconsistente para generar candidatos a soluciones con retroalimentación de ejecución de código (SC-TIR); y cuatro conjuntos de validación cuidadosamente seleccionados de AMC, AIME y MATH para guiar la selección del modelo y evitar el sobreajuste a las clasificaciones públicas.