En el campo médico moderno, la inteligencia artificial (IA) se está convirtiendo gradualmente en una herramienta importante para mejorar la eficiencia laboral, mejorar la comunicación con los pacientes y apoyar el diagnóstico y el tratamiento. Para satisfacer las necesidades de los sistemas de IA médica en términos de rendimiento, eficiencia y protección de la privacidad, nació Health AI Developer Foundations (HAI-DEF).

Este proyecto incluye una serie de modelos abiertos ligeros, cuyo objetivo es brindar a los desarrolladores una base sólida para apoyar sus investigaciones y desarrollo de aplicaciones en salud. La apertura de los modelos HAI-DEF garantiza que los desarrolladores puedan controlar completamente la privacidad de los datos, la infraestructura y las modificaciones del modelo.

image.png

En mayo de este año, ampliamos HAI-DEF y lanzamos MedGemma, un conjunto de modelos generativos basados en Gemma3, diseñados para acelerar el desarrollo de IA en los campos de la medicina y las ciencias de la vida. Recientemente, también lanzamos dos nuevos modelos: el modelo multimodal MedGemma27B y MedSigLIP. El modelo multimodal MedGemma27B añade soporte para la interpretación de datos multimodales complejos y registros electrónicos de salud longitudinales, sobre la base de los modelos multimodales de 4B y de texto de 27B. Por otro lado, MedSigLIP es un codificador ligero de imágenes y texto, adecuado para tareas como clasificación o búsqueda.

Los modelos MedGemma y MedSigLIP ofrecen un buen punto de partida para la investigación médica y el desarrollo de productos. MedGemma es especialmente adecuado para tareas médicas que requieren generar textos libres, como la generación de informes o preguntas visuales; mientras que MedSigLIP se recomienda para tareas de imagen que requieran salidas estructuradas, como clasificación o recuperación. Estos modelos pueden ejecutarse en una sola GPU, y MedGemma4B y MedSigLIP también pueden adaptarse a hardware móvil.

image.png

La apertura de los modelos de la serie MedGemma permite a los desarrolladores descargar, construir y ajustar finamente los modelos según sus necesidades específicas. Esta forma de apertura tiene ventajas significativas en el ámbito médico en comparación con los modelos API. Los desarrolladores pueden ejecutar los modelos en su entorno preferido, manejando de forma flexible cuestiones de privacidad y políticas institucionales; al mismo tiempo, mediante el ajuste fino y la modificación, los desarrolladores pueden optimizar el rendimiento del modelo, asegurando estabilidad y repetibilidad, lo cual es particularmente importante en aplicaciones médicas.

Para ayudar a los desarrolladores a comenzar rápidamente, proporcionamos cuadernos detallados en GitHub, que muestran cómo crear instancias de MedSigLIP y MedGemma en la plataforma Hugging Face y realizar inferencias y ajustes finos. Además, MedGemma y MedSigLIP también se pueden desplegar sin problemas en Vertex AI, ofreciendo soporte de puntos finales especializados.

Blog: https://research.google/blog/medgemma-our-most-capable-open-models-for-health-ai-development/

Puntos clave:

🌟 HAI-DEF presenta MedGemma y MedSigLIP, brindando un fuerte apoyo al desarrollo de IA médica.  

🔍 MedGemma es adecuado para tareas de generación de texto libre, mientras que MedSigLIP se enfoca en la clasificación y recuperación de imágenes.  

🔑 La flexibilidad de los modelos abiertos permite a los desarrolladores optimizar y ajustar finamente los modelos de forma segura en entornos locales.