El CEO de Microsoft, Satya Nadella, anunció recientemente en una plataforma social que Microsoft lanzó oficialmente un sistema revolucionario de inteligencia artificial médica MAI-DxO. Este innovador sistema destaca por su diseño único de "independiente del modelo", lo que le permite adaptarse flexiblemente a diferentes modelos de lenguaje de distintos fabricantes y capacidades, mejorando así significativamente su rendimiento diagnóstico. Más emocionante aún, MAI-DxO no solo simula el proceso de diagnóstico de un médico real, sino que también demostró una tasa de precisión de diagnóstico mucho mayor que la de médicos profesionales en pruebas, al mismo tiempo que reduce considerablemente los costos de diagnóstico médico.

Los datos de prueba publicados por Microsoft muestran que, en comparación con un conjunto de pruebas ocultas de 56 casos del New England Journal of Medicine, los médicos profesionales con más de diez años de experiencia tuvieron una precisión promedio de solo 19,9%. Sin embargo, cuando MAI-DxO utilizó el modelo o3 de OpenAI sin presupuesto, alcanzó una precisión del 81,9%; y en modo integrado alcanzó asombrosos 85,5%, lo que es más de cuatro veces la precisión de los médicos profesionales.

La innovación central de MAI-DxO radica en su simulación del modo de colaboración de un equipo médico real, mediante un grupo de médicos virtuales con roles diferentes que resuelven juntos problemas de diagnóstico, logrando así un avance significativo en la precisión del diagnóstico y la eficiencia económica. Este equipo de médicos virtuales incluye a Dr. Hypothesis, encargado de mantener y actualizar la lista de diagnósticos diferenciales; a Dr. Test-Chooser, quien selecciona las pruebas más discriminativas en cada ronda; a Dr. Challenger, quien actúa como supervisor, identifica sesgos y propone sugerencias desafiantes; a Dr. Stewardship, quien defiende la conciencia del costo y optimiza los planes de examen; y a Dr. Checklist, quien se encarga del control de calidad en la parte posterior y garantiza la consistencia del razonamiento.

Para adaptarse a las necesidades de diferentes escenarios médicos en cuanto a costo, eficiencia y precisión, MAI-DxO ofrece cinco modos de integración. Estos modos van desde el modo Instant Answer, que depende únicamente del resumen inicial del caso para un diagnóstico rápido, adecuado para situaciones de emergencia o escenarios con recursos limitados; hasta el modo Question Only, que diagnostica solo mediante preguntas, simulando atención primaria; el modo Budgeted, que introduce un mecanismo dinámico de control de presupuesto; el modo No Budget, orientado a maximizar la precisión del diagnóstico y tratar casos complejos y difíciles; y el modo Ensemble, que simula el trabajo paralelo de múltiples equipos de médicos para mejorar aún más la precisión del diagnóstico.

Con el lanzamiento de MAI-DxO, Microsoft también presentó un benchmark profesional de diagnóstico secuencial en medicina llamado SDBench. Este marco de evaluación interactivo convierte 304 casos diagnósticos desafiantes del New England Journal of Medicine