谷歌推出开源嵌入模型EmbeddingGemma,专为移动设备设计。该模型拥有308百万参数,在MTEB基准测试中被评为500M以下最佳多语言文本嵌入模型。支持检索增强生成和语义搜索功能,无需联网即可在手机上运行,性能优越。
s3dev-ai
这是Google embeddinggemma-300m基础模型的各种GGUF格式量化版本,专门为高效部署和不同场景使用而优化。该模型专注于句子嵌入和相似度计算任务。
mlx-community
这是一个转换为MLX格式的文本嵌入模型,基于Google的EmbeddingGemma-300m模型转换而来,专门用于句子相似度计算和文本嵌入任务。模型采用BF16精度,适用于苹果芯片设备上的高效推理。
EmbeddingGemma-300m-8bit是基于sentence-transformers库实现的句子相似度模型,支持以MLX格式运行,专门用于计算句子嵌入和相似度。该模型从原始模型转换而来,提供高效的文本特征提取能力。
EmbeddingGemma 300M 4bit是Google开发的轻量级文本嵌入模型,专门针对MLX框架优化。该模型能够将文本转换为高质量的向量表示,适用于各种自然语言处理任务,特别是句子相似度计算和特征提取。
ggml-org
embeddinggemma-300m-qat-q8_0 GGUF 是一款基于Google embeddinggemma-300m模型的量化版本,专门用于特征提取和句子相似度计算。该模型经过量化优化,在保持较高精度的同时显著减小了模型大小和推理开销。
embeddinggemma-300M是一个经过量化优化的轻量级文本嵌入模型,基于Google的embeddinggemma架构,采用QAT(量化感知训练)和Q4_0量化技术,参数量为300M。该模型专门用于生成高质量的文本嵌入向量,支持句子相似度计算和特征提取等任务。
Claude本地语义代码搜索工具,使用EmbeddingGemma模型实现完全离线的多语言代码智能搜索,通过MCP协议与Claude Code集成,保护隐私且无需API密钥