DataGemma RIG es una serie de modelos Gemma 2 ajustados para ayudar a los modelos lingüísticos grandes (LLM) a acceder e integrar datos estadísticos públicos confiables de Data Commons. El modelo emplea un método de generación por recuperación, consultando la interfaz de lenguaje natural existente de Data Commons mediante consultas en lenguaje natural y anotando los datos estadísticos en las respuestas. DataGemma RIG se entrenó en TPUv5e usando JAX. Actualmente es una versión temprana, destinada principalmente a fines académicos y de investigación, y no está preparada para uso comercial o público.