In der kürzlich abgeschlossenen Google I/O-Entwicklerkonferenz 2025 gab das Unternehmen die Open-Source-Version eines völlig neuen medizinischen AI-Modells bekannt – MedGemma. Dieses auf der Gemma3-Architektur basierende Modell wurde speziell für den medizinischen Bereich entwickelt und verfügt über starke Fähigkeiten zur Multimodalität von Bildern und Texten, um die Effizienz von medizinischer Diagnose und Therapie zu steigern.

MedGemma bietet zwei Konfigurationsvarianten mit 4B und 27B Parametern. Das 4B-Parametrierungsmodell wird hauptsächlich für die Klassifizierung und Interpretation medizinischer Bilder eingesetzt und kann detaillierte Diagnoseberichte generieren oder Fragen im Zusammenhang mit Bildern beantworten; das 27B-Parametrierungsmodell hingegen konzentriert sich auf die Verarbeitung klinischer Texte und ist ideal für Patienten-Triagierung und Entscheidungsunterstützung. Dies bedeutet, dass Ärzte schnell wertvolle Informationen über den Zustand ihrer Patienten erhalten können und somit effizientere Behandlungsmethoden entwickeln können.

Künstliche Intelligenz in der Medizin

Quellenhinweis: Das Bild wurde durch KI generiert, Lizenzdienstleister Midjourney

Das Bilderkodierungsmodul des 4B-Modells nutzt SigLIP-Technologie und basiert auf einer Vorverarbeitung mit Bildern aus verschiedenen Bereichen wie Brust-Röntgen, Dermatologie, Augenheilkunde und Gewebepathologie, was es ihm ermöglicht, komplexe medizinische Bilder hervorragend zu bearbeiten. Im Vergleich dazu basiert das 27B-Modell auf 27 Milliarden Parametern und konzentriert sich auf die tiefgehende Analyse medizinischer Texte, um klinische Schlussfolgerungen zu unterstützen und den Arzt beim schnelleren Entscheiden zu helfen.

Noch flexibler ist, dass Entwickler diese Modelle lokal für Experimente nutzen können oder sie über den Vertex AI-Plattform von Google Cloud als HTTPS-Endpunkt bereitstellen können, um sie auf großem Umfang anzuwenden. Google stellt außerdem eine Vielzahl von Ressourcen zur Verfügung, darunter Colab-Notebooks, um Entwicklern bei der Anpassung und Integration der Modelle zu helfen.

Außerdem ermutigt Google Entwickler, die Modelle für bestimmte Einsatzszenarien zu validieren und anzupassen und bietet entsprechende Anleitungen und Werkzeuge zur Verfügung, um während des Anpassungsprozesses Methoden wie Prompt Engineering, Contextual Learning und LoRA effizient zum Parameteranpassen einzusetzen. Dadurch wird MedGemma nicht nur zu einem fortschrittlichen AI-Werkzeug, sondern auch zu einem wichtigen Helfer für Entwickler und medizinisches Personal im täglichen Einsatz.

Die Einführung von MedGemma markiert einen weiteren bedeutenden Fortschritt im Bereich der medizinischen KI und bringt unermessliche Möglichkeiten für zukünftige medizinische Praxis.