Kürzlich hat Google eine wichtige Aktualisierung für seine Gemini-Serie von großen Sprachmodellen (LLM) vorgenommen, insbesondere für Gemini 2.5 Flash und Flash Lite, wobei der Fokus auf Verbesserungen in Geschwindigkeit und Effizienz lag. Diese Verbesserungen werden kontinuierlich zwischen den großen Versionen durchgeführt und zeigen eindrucksvoll, wie sehr Google sich in der KI-Entwicklung weiterentwickelt.

image.png

Laut Bewertungen des unabhängigen Analyseunternehmens Artificial Analysis ist Gemini 2.5 Flash Lite bereits das „schnellste proprietäre Modell“ auf deren Website, mit einer Ausgabegeschwindigkeit von 887 Ausgabetoken pro Sekunde, was eine Steigerung um 40 % gegenüber der vorherigen Version darstellt. Obwohl es noch hinter dem neuen offenen K2Think-Modell von MBZUAI und G42AI zurückbleibt, das 2.000 Ausgabetoken pro Sekunde ausgibt, bleibt die Geschwindigkeit von Gemini 2.5 Flash Lite beeindruckend.

image.png

Diese beiden neuen Modelle zeigten erhebliche Verbesserungen in Bezug auf Ausgabegüte und Kosten-Effizienz, insbesondere bei der Nutzung von Tokens und der Reaktionsgeschwindigkeit. Gemini 2.5 Flash zeigte sich besonders gut bei der Bearbeitung von mehrschrittigen und autonomen Arbeitsabläufen, wobei sein Score im SWE-Bench Verified-Test auf 54 % gestiegen ist. Flash Lite zeigte zudem Verbesserungen bei der Befehlsausführung und der multimodalen Fähigkeit, wobei die Anzahl der Ausgabetoken um 50 % reduziert wurde, was in hochdurchsatzintensiven Anwendungen die Betriebskosten senkt.

In unabhängigen Benchmarks wurden die Leistungen von Gemini 2.5 Flash und Flash Lite weiter bestätigt, wobei die Scores des ersten Modells in mehreren Tests deutlich verbessert wurden. Um Entwicklern die Nutzung zu erleichtern, führte Google auch neue Aliase ein, um die Integration der neuesten Modellversionen zu vereinfachen.

Die aktualisierten LLMs sind nicht die einzigen Verbesserungen: Google hat auch Gemini Live verbessert, ein Echtzeit-Audio-Modell, das speziell für Sprachanwendungen konzipiert ist. Die neue Version verbesserte die Zuverlässigkeit der Funktionsaufrufe und die Fähigkeit, natürliche Gespräche zu verarbeiten. Entwickler können nun effizientere Sprachassistenten erstellen, die in dynamischen Umgebungen besser mit Benutzern interagieren können. Nutzer können direkt die neue Vorschauversion verwenden, um das aktualisierte Gemini Live-Modell zu nutzen.

Die aktuelle Aktualisierung von Google erhöhte nicht nur die Leistungsfähigkeit und Zugänglichkeit der Modelle, sondern bot auch Entwicklern mehr Flexibilität. In Zukunft plant Google weitere Updates in der Gemini-Serie, um die sich ständig verändernden Bedürfnisse der Entwickler zu erfüllen.

Wichtige Punkte:

🌟 Gemini 2.5 Flash Lite ist das schnellste proprietäre Modell mit einer Ausgabegeschwindigkeit von 887 Ausgabetoken pro Sekunde.

🚀 Die neuen Modelle haben eine deutliche Verbesserung bei der Ausgabegüte und der Kosteneffizienz gebracht, insbesondere reduzierte Flash Lite die Ausgabetoken um 50 %.

🗣️ Die Aktualisierung von Gemini Live verbesserte die Funktionen von Sprachassistenten und erhöhte die Genauigkeit bei Funktionsaufrufen sowie die Fähigkeit, natürliche Gespräche zu verarbeiten.