En la conferencia Google I/O de 2025, Google lanzó oficialmente el modelo multimodal ligero Gemma3n y anunció la expansión continua de la familia de modelos Gemma, con la incorporación de MedGemma, orientado a escenarios médicos, y SignGemma, para accesibilidad.
Como representante de la tendencia de ejecución local de IA, Gemma3n está diseñado específicamente para dispositivos con bajo rendimiento como teléfonos, laptops y tabletas, y es capaz de procesar texto, audio, imágenes y videos. Según Google, Gemma3n incluso puede funcionar fluidamente en dispositivos con menos de 2 GB de memoria RAM, destacando su eficiente arquitectura. El modelo ya está disponible en versión preliminar para desarrolladores y comparte la misma infraestructura subyacente con Gemini Nano.
Google enfatizó las ventajas de ligereza y privacidad de Gemma3n, lo que lo convierte en una opción ideal para aplicaciones de IA sin conexión. En comparación con los grandes modelos que dependen del cloud, los modelos de IA locales no solo responden más rápidamente y son menos costosos, sino que también protegen los datos del usuario al evitar enviarlos a servidores remotos, especialmente útil en escenarios sensibles a la privacidad.
En el ámbito de la salud, Google, a través de su fondo de desarrollo de IA para la salud, presentó MedGemma, un conjunto de modelos abiertos diseñados para analizar texto e imágenes relacionadas con la salud. Se informa que MedGemma tiene una capacidad excepcional de análisis multimodal, permitiendo a los desarrolladores construir herramientas de IA más precisas para la identificación de imágenes médicas y el procesamiento de historias clínicas.
Además, Google anunció el próximo lanzamiento del modelo SignGemma, diseñado específicamente para la detección de lenguaje de señas, capaz de traducir el lenguaje de señas estadounidense (ASL) al texto en inglés. Esto busca ayudar a los desarrolladores a crear herramientas de comunicación más accesibles para usuarios sordos y con discapacidad auditiva. Google afirmó que se trata del "modelo de comprensión de lenguaje de señas más potente hasta ahora".
A pesar de que la serie de modelos Gemma ha generado preocupación entre algunos desarrolladores debido a sus términos de licencia no estándar sobre el uso comercial, su amplia funcionalidad ha recibido una respuesta entusiasta por parte de la comunidad de desarrolladores, con más de millones de descargas de la serie de modelos Gemma.
Con la continuación del crecimiento de la familia de modelos Gemma, Google está promoviendo el uso de modelos de IA abiertos en dispositivos locales, protección de la privacidad en el dispositivo, salud y accesibilidad a un espacio de aplicación más amplio.