El equipo Seed de ByteDance ha revelado recientemente los sorprendentes resultados del examen de ingreso a la universidad de 2025 en todas las materias: el modelo Seed1.6-Thinking de Douyin obtuvo 683 puntos en ciencias sociales y 648 puntos en ciencias naturales, alcanzando la puntuación de admisión en Pekín y Tsinghua, destacando notablemente en las pruebas de modelos de inteligencia artificial en el ámbito nacional e internacional.

Modelo de gran tamaño de Douyin de ByteDance

Este test se realizó con los exámenes de la nueva edición nacional y los exámenes autónomos de Shandong. Douyin compitió con cinco modelos de inteligencia artificial de primer nivel, como Gemini 2.5Pro de Google, DeepSeek R1 y OpenAI o3. La puntuación de Douyin en ciencias sociales fue de 683 puntos, obteniendo la puntuación más alta entre los modelos evaluados, mientras que su puntuación en ciencias naturales fue de 648 puntos, solo superada por los 655 puntos de Gemini 2.5Pro de Google. En cuanto a las materias individuales, Douyin obtuvo la puntuación más alta en seis asignaturas: chino, inglés, física, historia, geografía y política, y su puntuación en matemáticas también superó los 140 puntos, demostrando una excelente capacidad de razonamiento lógico.

En esta "batalla de exámenes de ingreso a la universidad" de inteligencia artificial, cada modelo mostró sus propias fortalezas en diferentes materias. DeepSeek R1 obtuvo la puntuación más alta en matemáticas con 145 puntos, Gemini 2.5Pro logró la puntuación más alta en química con 82 puntos, y OpenAI o3 obtuvo junto con Gemini 2.5Pro la puntuación más alta en biología con 77 puntos. Esta diferencia en el rendimiento refleja las características únicas de los distintos modelos de inteligencia artificial en términos de estructura del conocimiento y métodos de razonamiento.

QQ20250626-095943.png

El equipo Seed descubrió un importante detalle técnico: durante el primer test, debido a la baja calidad de las copias de los exámenes en línea, todos los modelos perdieron muchos puntos en materias que dependen de imágenes, como química y biología. Después de obtener las imágenes de los exámenes en alta resolución, el equipo repitió la prueba utilizando un enfoque combinado de texto e imágenes. Los resultados mostraron que Douyin mejoró casi 30 puntos en química y biología, alcanzando una puntuación total en ciencias naturales de 676 puntos. Este descubrimiento validó la importancia del razonamiento multimodal para liberar el potencial de los modelos, brindando importantes ideas para el desarrollo de la inteligencia artificial en comprensión visual y razonamiento multimodal.

Shandong utiliza el modelo de examen de ingreso a la universidad "3+3", donde chino, matemáticas y inglés son materias básicas, y otras tres materias elegidas se califican según un sistema de calificación por niveles. Según el análisis de un profesor experimentado de secundaria local, la puntuación calificada de Douyin podría alcanzar aproximadamente 690 puntos, y según la tabla de distribución por puntos de Shandong en 2025, estaría entre los 80 primeros, lo suficiente para competir por las universidades de élite como Pekín y Tsinghua. Este desempeño no solo muestra la fuerza absoluta de Douyin, sino que también demuestra su capacidad de adaptación en sistemas de calificación complejos.