Lors de la conférence annuelle des développeurs I/O 2025, Google a annoncé l'ouverture du code d'un tout nouveau modèle d'intelligence artificielle médicale appelé MedGemma. Ce modèle, basé sur l'architecture Gemma3, a été conçu spécifiquement pour le domaine médical et possède une capacité impressionnante à comprendre simultanément des images et du texte, visant à améliorer l'efficacité des diagnostics et des traitements.
MedGemma propose deux configurations : un modèle de 4 milliards de paramètres et un autre de 27 milliards de paramètres. Le modèle à 4 milliards de paramètres est principalement utilisé pour la classification et l'interprétation d'images médicales, capable de générer des rapports de diagnostic détaillés ou de répondre à des questions liées aux images ; tandis que le modèle à 27 milliards de paramètres se concentre sur le traitement de textes cliniques, idéal pour le triage des patients et l'aide à la prise de décision. Cela signifie que les médecins peuvent obtenir plus rapidement des informations précieuses sur l'état des patients, permettant ainsi une planification plus efficace des traitements.
Crédit image : Image générée par une IA, fournisseur d'autorisation Midjourney
Le modèle à 4 milliards de paramètres utilise une technologie appelée SigLIP pour son encodeur d'images. Les données pré-entraînées couvrent divers domaines tels que les radiographies thoraciques, la dermatologie, l'ophtalmologie et la pathologie tissulaire, ce qui lui confère des performances exceptionnelles dans le traitement d'images médicales complexes. En comparaison, le modèle à 27 milliards de paramètres, avec ses 270 milliards de paramètres, se concentre sur une compréhension approfondie des textes médicaux, soutenant ainsi la déduction clinique et aidant les professionnels de santé à prendre des décisions plus rapidement.
De plus, les développeurs ont la possibilité d'exécuter ces modèles localement pour des expérimentations ou de les déployer via la plateforme Vertex AI de Google sous forme d'API HTTPS, facilitant ainsi leur utilisation à grande échelle. Google fournit également de nombreuses ressources, notamment des carnets Colab, pour aider les développeurs à affiner et intégrer les modèles.
En outre, Google encourage les développeurs à valider et affiner les modèles pour des scénarios spécifiques, en fournissant des guides et des outils correspondants. Les méthodes telles que l'ingénierie des prompts, l'apprentissage contextualisé et LoRA sont disponibles pour optimiser efficacement les ajustements des paramètres. Cela rend MedGemma non seulement un outil avancé d'intelligence artificielle, mais aussi un assistant crucial pour améliorer l'efficacité des développeurs et des professionnels de santé dans leur travail quotidien.
Le lancement de MedGemma marque une nouvelle avancée significative dans le domaine de l'intelligence artificielle médicale, ouvrant des perspectives infinies pour les pratiques médicales futures.