Bei der Google I/O Developer Conference 2025 stellte Google das leichte multimodale Modell Gemma3n offiziell vor und kündigte die kontinuierliche Erweiterung der Gemma-Modellfamilie an, wobei neue Modelle für medizinische Anwendungen und Barrierefreiheit – MedGemma und SignGemma – hinzugefügt wurden.

Als Vertreter der Trendrichtung „lokales AI-Laufwerk“, wurde Gemma3n speziell für Geräte mit geringem Rechenleistungsspektrum wie Smartphones, Laptops und Tablets entwickelt und ist in der Lage, Texte, Audiodaten, Bilder und Videos zu verarbeiten. Laut Google kann Gemma3n sogar auf Geräten mit weniger als 2 GB Arbeitsspeicher reibungslos laufen, was seine effiziente Architektur unterstreicht. Das Modell wurde am Veröffentlichungstag für Entwickler als Vorschau zur Verfügung gestellt und teilt die Grundarchitektur mit Gemini Nano.

QQ20250521-094734.png

Google betonte, dass die Leichtigkeit und Datenschutzvorteile von Gemma3n es zu einer idealen Wahl für offline-basierte AI-Anwendungen machen. Im Vergleich zu großen Modellen, die auf der Cloud basieren, sind lokale AI-Modelle nicht nur schneller und kostengünstiger, sondern schützen auch die Nutzerdaten, indem diese nicht auf entfernte Server übertragen werden – insbesondere in privacy-sensitive Szenarien.

In der Gesundheitsbranche hat Google durch die „Google Health AI Developer Foundation“ MedGemma vorgestellt – ein Open-Source-Set von Modellen für die Analyse von gesundheitsbezogenen Texten und Bildern. Es wird behauptet, dass MedGemma ausgezeichnete Multimodalitätsfähigkeiten besitzt und Entwicklern dabei hilft, präzisere AI-Werkzeuge für die Erkennung medizinischer Bilder und die Verarbeitung von Krankenakten zu erstellen.

Außerdem gab Google eine bald erscheinende Version des SignGemma-Modells bekannt, das speziell für die Handsprachenerkennung entwickelt wurde und die amerikanische Gebärdensprache (ASL) in englische Texte übersetzen kann. Dies soll Entwicklern helfen, Kommunikationswerkzeuge für gehörlose und schwerhörige Benutzer zu schaffen. Google bezeichnete dies als „das bisher leistungsfähigste Modell für die Erkennung von Gebärdensprache“.

Obwohl die Gemma-Modellreihe aufgrund ihrer nicht standardmäßigen Lizenzbedingungen von einigen Entwicklern bezüglich der kommerziellen Nutzung besorgt sind, erhielt sie weiterhin große Resonanz in der Entwicklercommunity, und die Downloads der Gemma-Modelle haben bereits mehrere Millionen erreicht.

Während sich die Gemma-Modellfamilie ständig ausweitet, treibt Google die breitere Nutzung offener AI-Modelle im Gerät, lokal geschützte Privatsphäre, im Gesundheitswesen sowie in der Barrierefreiheit voran.