Gemma 2 ist ein Open-Source-AI-Modell der nächsten Generation von Google DeepMind, das in Versionen mit 900 Millionen und 2,7 Milliarden Parametern verfügbar ist. Es zeichnet sich durch überragende Leistung und Inferenz-Effizienz aus und kann auf unterschiedlicher Hardware mit voller Präzision und hoher Effizienz betrieben werden, wodurch die Bereitstellungskosten erheblich gesenkt werden. Die 2,7-Milliarden-Parameter-Version von Gemma 2 bietet die doppelte Leistung im Vergleich zu Modellen vergleichbarer Größe und kann auf einer einzelnen NVIDIA H100 Tensor Core GPU oder TPU-Host ausgeführt werden, was die Bereitstellungskosten deutlich reduziert.