谷歌推出開源嵌入模型EmbeddingGemma,專爲移動設備設計。該模型擁有308百萬參數,在MTEB基準測試中被評爲500M以下最佳多語言文本嵌入模型。支持檢索增強生成和語義搜索功能,無需聯網即可在手機上運行,性能優越。
s3dev-ai
這是Google embeddinggemma-300m基礎模型的各種GGUF格式量化版本,專門為高效部署和不同場景使用而優化。該模型專注於句子嵌入和相似度計算任務。
mlx-community
這是一個轉換為MLX格式的文本嵌入模型,基於Google的EmbeddingGemma-300m模型轉換而來,專門用於句子相似度計算和文本嵌入任務。模型採用BF16精度,適用於蘋果芯片設備上的高效推理。
EmbeddingGemma-300m-8bit是基於sentence-transformers庫實現的句子相似度模型,支持以MLX格式運行,專門用於計算句子嵌入和相似度。該模型從原始模型轉換而來,提供高效的文本特徵提取能力。
EmbeddingGemma 300M 4bit是Google開發的輕量級文本嵌入模型,專門針對MLX框架優化。該模型能夠將文本轉換為高質量的向量表示,適用於各種自然語言處理任務,特別是句子相似度計算和特徵提取。
ggml-org
embeddinggemma-300m-qat-q8_0 GGUF 是一款基於Google embeddinggemma-300m模型的量化版本,專門用於特徵提取和句子相似度計算。該模型經過量化優化,在保持較高精度的同時顯著減小了模型大小和推理開銷。
embeddinggemma-300M是一個經過量化優化的輕量級文本嵌入模型,基於Google的embeddinggemma架構,採用QAT(量化感知訓練)和Q4_0量化技術,參數量為300M。該模型專門用於生成高質量的文本嵌入向量,支持句子相似度計算和特徵提取等任務。
Claude本地語義代碼搜索工具,使用EmbeddingGemma模型實現完全離線的多語言代碼智能搜索,通過MCP協議與Claude Code集成,保護隱私且無需API密鑰