23 de julio, informe: El modelo de salud de Quark ha superado con éxito las pruebas escritas de 12 materias principales de la medicina china por parte de los jefes de departamento médicos, convirtiéndose en el primer modelo de inteligencia artificial en completar este desafío en el país. Actualmente, la capacidad de "médico de nivel jefe" ya está completamente integrada en la búsqueda de inteligencia artificial de Quark. Los usuarios pueden acceder a ella seleccionando búsqueda profunda al consultar problemas de salud.

Esto representa otro salto en la capacidad del modelo de salud de Quark, tras haber superado con éxito el examen de título de médico subdirector en mayo. En comparación con modelos generales y especializados, el modelo de salud de Quark muestra una curva de rendimiento en la que cuanto mayor es la dificultad, más destacada es su ventaja, demostrando un avance en tareas complejas de razonamiento médico.

QQ20250723-133844.png

Esto revela el gran potencial de desarrollar modelos especializados en el campo médico. El modelo de salud de Quark se basa en Qwen y ha recorrido un camino de ingeniería profunda orientado a escenarios verticales. "No estamos entrenando a la IA para responder preguntas médicas, sino para que aprenda a pensar como un médico", dijo Xu Jian, responsable del algoritmo de salud de Quark.

Una de las principales innovaciones del modelo de salud de Quark es la construcción de una "capacidad de pensamiento lento". Esta capacidad combina el razonamiento en cadena y el modelado de rutas clínicas de múltiples etapas, lo que permite al modelo deducir respuestas finales de manera progresiva y detallada cuando enfrenta problemas médicos complejos.

QQ20250723-133851.png

El requisito previo para construir esta capacidad de pensamiento lento es tener datos de entrenamiento de razonamiento de alta calidad. Para ello, Quark ha construido un sistema de ingeniería denominado "dos líneas de producción de datos + dos mecanismos de recompensa". Por un lado, clasifica los datos médicos en dos categorías: "verificables" y "no verificables", correspondientes respectivamente a tareas de diagnóstico y a tareas de consejos de salud; por otro lado, introduce "modelos de recompensa por proceso" y "modelos de recompensa por resultado" en los métodos de entrenamiento, evaluando respectivamente la racionalidad de la cadena de razonamiento del modelo y la precisión de la conclusión final, mejorando significativamente la explicabilidad clínica y la coherencia del razonamiento del modelo.

Este sistema también incluye un flujo de aprendizaje por refuerzo en varias etapas, que incluye una estricta validación manual de los datos de inicio, estrategias de selección de muestras en múltiples rondas y entrenamiento progresivo en dificultad, así como un mecanismo de identificación de trampas para prevenir "trampas de puntuación alta". A través del aprendizaje por refuerzo impulsado por datos completos "pregunta-pensamiento-respuesta" etiquetados por médicos reales, el modelo de salud de Quark no solo ha aprendido conocimientos médicos, sino que también ha adquirido habilidades de selección de caminos de pensamiento médico, integración de evidencia y equilibrio entre múltiples soluciones. La base de conocimientos médicos autoritarios en la capa inferior garantiza que el contenido generado por el modelo sea profesional y actualizado.

El doctor Xie Jingsheng, jefe del departamento de cirugía cardíaca del Hospital Anzhen, considera que la profundidad de las respuestas de Quark en ciertos temas supera incluso a la de médicos profesionales. Este logro se debe a la participación activa de equipos médicos profesionales. Actualmente, el modelo de salud de Quark cuenta con un equipo de más de mil médicos especializados, entre los cuales más de 400 son expertos médicos con título de subdirector o superior.