Neue Nachrichten von der Deep Learning-Team bei Google: Sie haben offiziell EmbeddingGemma vorgestellt, ein Open-Source-Einbettungsmodell, das speziell für mobile Geräte entwickelt wurde. EmbeddingGemma hat aufgrund seiner effizienten Ausgestaltung mit 308 Millionen Parametern die besten Leistungen im MTEB (Massive Text Embedding Benchmark) unter Modellen mit weniger als 500M Parametern erzielt und zeigt starke Funktionen wie Retrieval-Augmented Generation (RAG) und semantische Suche, die direkt auf Mobilgeräten wie Smartphones ohne Internetverbindung laufen können.

Die Vorteile von EmbeddingGemma liegen darin, dass seine Leistung mit fast doppelt so großen populären Modellen konkurrieren kann. Es ist nicht nur klein, sondern auch flexibel und eignet sich für verschiedene Szenarien. Es unterstützt anpassbare Ausgabedimensionen von 768 bis 128 und verfügt über ein Kontext-Token-Fenster von 2000, sodass es auf alltäglichen Geräten wie Smartphones, Laptops und Desktops laufen kann. Darüber hinaus ist es mit verschiedenen beliebten Tools integriert, sodass Benutzer es bequem mit sentence-transformers, MLX und Ollama usw. nutzen können.
EmbeddingGemma zeigt ausgezeichnete Leistungen beim Aufbau eines RAG-Pipelines, da es in der Lage ist, Texteinbettungen zu generieren, also Text in numerische Darstellungen umzuwandeln, um seinen Sinn in einem hochdimensionalen Raum darzustellen. In einer RAG-Pipeline werden zunächst Einbettungen basierend auf der Eingabe des Nutzers generiert und deren Ähnlichkeit mit allen Dokumenteneinbettungen im System berechnet, um die relevantesten Textabschnitte zu finden. Diese hochwertigen Einbettungen sorgen dafür, dass die endgültigen Antworten präzise und kontextbezogen sind.
Zusätzlich ist EmbeddingGemma in Bezug auf Geschwindigkeit und Ressourcenverbrauch sorgfältig gestaltet und bietet Merkmale wie Kleinheit, Schnelligkeit und Effizienz. Seine Einbettungsinferenzzeit liegt unter 15 Millisekunden und ermöglicht Echtzeitinteraktionen. Seine Offline-Funktion gewährleistet die Privatsphäre der Benutzerdaten und ist besonders geeignet für die Entwicklung mobiler Anwendungen.
Entwickler können EmbeddingGemma jetzt nutzen, um personalisierte Chatbots zu realisieren, Dateisuchen durchzuführen oder schnell Fine-Tuning für bestimmte Bereiche durchzuführen. Ob in offline-Anwendungen oder serverseitigen Anwendungen mit hoher Leistungsfähigkeit – EmbeddingGemma bietet eine ideale Wahl.
Offizieller Blog: https://developers.googleblog.com/en/introducing-embeddinggemma/
Wichtige Punkte:
🌟 EmbeddingGemma ist ein Open-Source-Einbettungsmodell mit 308M Parametern, speziell für mobile Geräte entwickelt und in der Lage, ohne Internetverbindung zu laufen.
📱 Es unterstützt die Integration verschiedener Tools und ist flexibel für verschiedene Anwendungsszenarien geeignet, um die Bedürfnisse von Entwicklern zu erfüllen.
🔒 Starke Offline-Funktionen gewährleisten die Sicherheit der Benutzerdaten und erhöhen den Datenschutz, wodurch mobile Anwendungen zuverlässige Unterstützung erhalten.



