Hace unos días, el modelo de gran inteligencia médica Baichuan-M2Plus fue oficialmente lanzado por Baichuan, junto con la actualización de la aplicación complementaria Bai Xiaoying y la apertura de interfaces de API. Esta lanzamiento marca un importante avance posterior a la apertura de código abierto de Baichuan-M2 en agosto. Según las evaluaciones, M2Plus muestra un excelente rendimiento en la tasa de alucinaciones médicas, reduciéndose significativamente en comparación con los grandes modelos generales, especialmente en comparación con los productos médicos existentes DeepSeek, donde la tasa de alucinaciones se redujo aproximadamente 3 veces, e incluso superó la popular aplicación médica estadounidense OpenEvidence.

QQ20251022-150030.png

M2Plus, con su innovadora forma de razonamiento basado en evidencia de seis fuentes (EAR), se ha convertido en el "ChatGPT para médicos". Este modelo aborda los problemas de aplicación en escenarios médicos serios, integrando investigación original, revisiones de evidencia, normas de guías, conocimiento práctico, educación en salud pública y información real regulada, construyendo un sistema completo de conocimiento médico, asegurando así la confiabilidad y la ciencia de las decisiones médicas.

En cuanto a la recuperación basada en evidencia, M2Plus utiliza el marco PICO, convirtiendo las consultas médicas en preguntas estructuradas, asegurando que la información recuperada sea precisa y confiable. El diseño único de este modelo permite a los médicos obtener evidencia médica de alta calidad y confiable al enfrentarse a problemas médicos complejos, mejorando significativamente la eficiencia del uso de la información médica.

Lo más importante es que el mecanismo de "entrenamiento potenciado por evidencia" de M2Plus al responder preguntas médicas hace que sus respuestas no solo estén basadas en la evidencia recuperada, sino que eviten efectivamente la generación de información aleatoria. Al reforzar la citación de fuentes autorizadas y evaluar la calidad de la evidencia, M2Plus demuestra una credibilidad comparable a la de expertos clínicos experimentados en aplicaciones reales.

QQ20251022-150040.png

En múltiples pruebas en escenarios médicos, el rendimiento de M2Plus recibió altas calificaciones de médicos clínicos, especialmente en el análisis de historias clínicas, la lógica diagnóstica y los planes de tratamiento, donde su precisión y profesionalidad fueron ampliamente reconocidas. Más notable aún es que, en el examen de elegibilidad para ejercer la medicina en Estados Unidos (USMLE), M2Plus obtuvo una sorprendente puntuación de 97 puntos, demostrando su superioridad en la capacidad de aplicar conocimientos médicos.

La lanzamiento del modelo de gran inteligencia Baichuan no solo inyecta nuevas fuerzas en la transformación digital de la industria médica china, sino que también representa un avance adicional de China en el ámbito global de los grandes modelos. Con el lanzamiento de M2Plus, se espera que tenga un impacto profundo en la ciencia y la eficacia de las decisiones clínicas.