In der modernen Medizin wird Künstliche Intelligenz (KI) zunehmend zu einem wichtigen Werkzeug, um die Effizienz zu steigern, die Kommunikation mit Patienten zu verbessern und bei Diagnosen und Behandlungen zu unterstützen. Um den Anforderungen an Leistung, Effizienz und Datenschutz von KI-Systemen im Gesundheitswesen gerecht zu werden, wurde Health AI Developer Foundations (HAI-DEF) ins Leben gerufen.

Dieses Projekt umfasst eine Reihe leichtgewichtiger offener Modelle, die Entwicklern eine starke Grundlage bieten, um ihre Gesundheitsforschung und Anwendungsentwicklung zu unterstützen. Die Offenheit der HAI-DEF-Modelle gewährleistet, dass Entwickler volle Kontrolle über Datenprivatsphäre, Infrastruktur und Modifikationen haben.

image.png

Im Mai dieses Jahres haben wir HAI-DEF erweitert und MedGemma vorgestellt, eine Reihe von Generativmodellen, die auf Gemma3 basieren und darauf abzielen, die Entwicklung von KI in den Bereichen Medizin und Lebenswissenschaften zu beschleunigen. Kürzlich haben wir außerdem zwei neue Modelle veröffentlicht: den MedGemma27B-Multimodal-Modell und MedSigLIP. Der MedGemma27B-Multimodal-Modell ergänzt die vorhandenen 4B-Multimodal- und 27B-Textmodelle um Unterstützung für komplexe Multimodalität und vertikale elektronische Gesundheitsakten. MedSigLIP ist ein leichter Bild- und Text-Encoder, der für Aufgaben wie Klassifizierung oder Suche geeignet ist.

Die MedGemma- und MedSigLIP-Modelle bieten eine gute Ausgangsbasis für medizinische Forschung und Produktentwicklung. MedGemma eignet sich besonders für medizinische Aufgaben, bei denen freier Text generiert werden muss, wie z. B. Berichte oder visuelle Fragen; während MedSigLIP für bildbasierte Aufgaben mit strukturierten Ausgaben, wie Klassifizierung oder Retrieval, empfohlen wird. Diese Modelle können auf einer einzelnen GPU laufen, wobei auch MedGemma4B und MedSigLIP für mobile Geräte anpassbar sind.

image.png

Die Offenheit der MedGemma-Reihe ermöglicht es Entwicklern, die Modelle herunterzuladen, zu bauen und entsprechend ihren spezifischen Anforderungen zu fine-tunen. Im Vergleich zu API-Modellen hat diese offene Herangehensweise im Gesundheitswesen deutliche Vorteile. Entwickler können die Modelle in ihrer bevorzugten Umgebung ausführen und flexibel auf Datenschutzprobleme und institutionelle Richtlinien reagieren; gleichzeitig können sie durch Fine-Tuning und Anpassungen die Modellleistung optimieren und sicherstellen, dass Stabilität und Wiederholbarkeit gewährleistet sind, was in medizinischen Anwendungen besonders wichtig ist.

Um Entwicklern den Einstieg zu erleichtern, stellen wir auf GitHub detaillierte Notebooks bereit, die zeigen, wie man auf der Hugging Face-Plattform Instanzen von MedSigLIP und MedGemma erstellt und Inferenz sowie Fine-Tuning durchführt. Darüber hinaus lassen sich MedGemma und MedSigLIP nahtlos in Vertex AI integrieren und erhalten dadurch spezialisierte Endpunkte.

Blog: https://research.google/blog/medgemma-our-most-capable-open-models-for-health-ai-development/

Zusammenfassung:

🌟 HAI-DEF stellt MedGemma und MedSigLIP vor, die eine starke Unterstützung für die Entwicklung von KI im Gesundheitswesen bieten.

🔍 MedGemma ist für Aufgaben zur Generierung freier Texte geeignet, während MedSigLIP sich auf Bildklassifizierung und Retrieval konzentriert.

🔑 Die Flexibilität der offenen Modelle ermöglicht es Entwicklern, Modelle sicher zu optimieren und anzupassen, in lokalen Umgebungen.