MongoDB推出Voyage AI模型系列,优化向量搜索性能,新增AI助手与自动嵌入功能,使数据库能理解语义并智能交互。核心突破在于提升数据语义理解精度,让开发者可通过自然语言查询数据,无需编写复杂查询语句。
OceanBase在2025年度发布会上开源AI数据库seekdb,支持三行代码快速构建知识库和智能体应用,处理百亿级多模数据检索。产品提供向量、全文、标量及空间地理数据的统一混合搜索,深度融合AI推理与数据处理,兼容Hugging Face等30多种主流AI框架,实现“开箱即用”的AI数据基座。
Google推出Gemini API的“文件搜索工具”,作为全托管RAG系统,可将私有文件直接转化为知识库。用户无需处理数据分块、嵌入生成等步骤,通过API即可实现高效检索与生成。工具核心是端到端集成,自动完成文件上传、索引和检索流程。
Apache Doris 4.0 正式发布,聚焦AI驱动、搜索增强和离线提效三大方向。新增向量索引和AI函数等特性,提升数据处理效率与用户体验。通过深度集成向量索引技术,高效处理文本嵌入等高维向量数据,支持用户在同一平台使用SQL进行结构化分析。
专为企业级AI应用构建的向量数据库
实时数据驱动的AI平台
一个完全由你掌控数据的「被动记录」项目。
Go语言库,用于嵌入式向量搜索和语义嵌入
Google
$0.7
Input tokens/M
$2.8
Output tokens/M
1k
Context Length
Tencent
$1
$4
32
Alibaba
$54
$163
Baidu
-
Bytedance
$0.8
$8
256
$0.5
Huawei
128
$2.4
$9.6
Openai
Baichuan
$15
$16
192
Moonshot
$10
$30
131
$200
Chatglm
$100
8
spartan8806
这是一个基于sentence-transformers/all-mpnet-base-v2微调而来的句子转换器模型,能够将文本映射到768维的密集向量空间,支持语义相似度计算、语义搜索、文本分类等多种自然语言处理任务。
redis
这是一个基于sentence-transformers库微调的BiEncoder模型,专门为LangCache语义缓存任务优化。模型将句子和段落映射到384维向量空间,支持语义相似度计算和语义搜索等任务。
Nihal2000
这是 sentence-transformers/all-MiniLM-L6-v2 模型的 TensorFlow Lite 转换版本,专门为边缘设备优化。该模型可将文本映射到384维向量空间,支持语义搜索、文本相似度计算等任务。提供Float32和INT8量化两个版本,量化版本体积缩小约4倍,在CPU上运行速度显著提升。
shtilev
这是一个多语言句子嵌入模型,可将句子和段落映射到768维向量空间,适用于聚类和语义搜索等任务。
Leo1212
这是一个基于allenai/longformer-base-4096微调的sentence-transformers模型,用于生成句子和段落的768维密集向量表示,适用于语义文本相似度、语义搜索等任务。
fangxq
XYZ-embedding-zh 是一个基于 sentence-transformers 的中文嵌入模型,能够将句子和段落映射到1792维的密集向量空间,适用于聚类和语义搜索等任务。
这是一个多语言的句子嵌入模型,能够将句子和段落映射到512维的密集向量空间,适用于聚类和语义搜索等任务。
bwang0911
这是一个基于BERT微调的句子转换器模型,用于将句子和段落映射到768维向量空间,支持语义文本相似性、语义搜索等任务。
Lauther
这是一个在测量领域数据集上微调的句子转换器模型,用于生成语义嵌入向量,支持语义文本相似性、语义搜索等任务。
dragonkue
这是一个从Snowflake/snowflake-arctic-embed-l-v2.0微调而来的句子转换器模型,训练数据为聚类数据集。它将句子和段落映射到一个1024维的密集向量空间,可用于语义文本相似度和语义搜索。
freelawproject
这是一个基于sentence-transformers库从nomic-ai/modernbert-embed-base微调而来的句子嵌入模型,专门针对三元组数据进行了优化训练,能够将文本映射到768维向量空间,适用于语义相似度计算和搜索任务。
BlackBeenie
这是一个从BAAI/bge-m3微调而来的sentence-transformers模型,用于将句子和段落映射到1024维稠密向量空间,支持语义文本相似度、语义搜索等任务。
x1saint
这是一个从intfloat/multilingual-e5-small微调而来的sentence-transformers模型,用于将句子和段落映射到384维的密集向量空间,支持语义文本相似度、语义搜索等任务。
这是一个从ModernBERT-large微调的sentence-transformers模型,用于将句子和段落映射到1024维的密集向量空间,支持语义文本相似性、语义搜索等任务。
avemio-digital
这是一个基于sentence-transformers框架,在JSON数据集上对ModernBERT-base模型进行微调得到的文本嵌入模型。它可以将句子和段落映射到768维的密集向量空间,适用于语义文本相似度计算、语义搜索等多种自然语言处理任务。
joe32140
这是一个基于 answerdotai/ModernBERT-large 的句子转换器模型,在 msmarco-co-condenser-margin-mse-sym-mnrl-mean-v1 数据集上进行了微调。该模型能够将句子和段落映射到1024维的密集向量空间,适用于语义文本相似度计算、语义搜索等多种自然语言处理任务。
TechWolf
这是一个基于sentence-transformers训练的模型,能够将句子和段落映射到768维的密集向量空间,适用于语义文本相似度计算、语义搜索等多种任务。
estrogen
这是一个基于estrogen/ModernBERT-base-sbert-initialized的句子转换器模型,在all-nli数据集上进行了微调。该模型能够将句子和段落映射到768维的密集向量空间,适用于语义文本相似度计算、语义搜索等多种自然语言处理任务。
Sinaof1381
这是一个基于句子转换器的波斯语句子嵌入模型,能够将波斯语句子和段落映射到1024维的密集向量空间,支持语义搜索、文本聚类等自然语言处理任务。
FINGU-AI
这是一个基于dunzhang/stella_en_1.5B_v5微调的sentence-transformers模型,用于生成句子和段落的1024维密集向量表示,适用于语义文本相似度、语义搜索等任务。
Claude Context是一个MCP插件,通过语义代码搜索为AI编程助手提供整个代码库的深度上下文,支持多种嵌入模型和向量数据库,实现高效代码检索。
Crawl4AI RAG MCP Server是一个集成网络爬虫和RAG功能的AI代理服务,支持智能URL检测、递归爬取、并行处理和向量搜索,旨在为AI编码助手提供强大的知识获取和检索能力。
一个基于Qdrant向量数据库的文档语义搜索服务,支持URL和本地文件导入,提供自然语言查询功能。
Pinecone MCP Server是一个为Claude Desktop设计的模型上下文协议服务器,提供与Pinecone索引的读写交互功能。
一个基于向量搜索的文档检索MCP服务,为AI助手提供相关文档上下文增强回答能力
Weaviate的MCP服务器,支持通过Smithery快速安装并与Claude Desktop集成,提供向量搜索和存储功能。
一个MCP服务器,通过向量嵌入和语义相似性为任何AI模型提供智能搜索Claude Agent Skills的能力,实现渐进式技能发现和跨平台技能共享
一个集成Qdrant向量数据库和MCP服务器的系统,用于存储和检索代码片段,支持自然语言搜索和语义检索。
一个基于Qdrant向量数据库的MCP记忆服务器,提供知识图谱和语义搜索功能。
一个基于MCP协议的嵌入向量搜索服务器,用于查询Turso数据库中的转录片段和嵌入向量,支持通过问题搜索相关片段。
Context Lens 是一个本地化语义搜索工具,可将任何内容转换为可搜索的知识库,让AI助手理解含义而非仅匹配关键词。它使用内置的LanceDB向量数据库,支持本地文件、GitHub仓库和URL内容,无需API密钥或云服务,完全在本地处理数据。
一个提供文件语义搜索功能的MCP服务器,通过向量嵌入实现文档内容的智能检索
一个基于MongoDB Atlas向量搜索和Voyage AI嵌入技术的文档检索系统,支持语义搜索和文本匹配,包含文档分块、嵌入生成和存储功能。
RagCode MCP是一个隐私优先的本地AI代码助手,通过语义向量搜索和RAG技术,让AI助手能够理解整个代码库,支持Go、PHP、Python等多种语言,无需云端依赖。
Terraform模块RAG引擎,支持多仓库自动导入、代码分析、向量存储和语义搜索,提供CLI、API和MCP服务接口。
一个基于Streamable HTTP MCP协议的远程ChromaDB服务器,为Claude等AI助手提供向量数据库的远程访问能力,支持跨平台共享记忆和语义搜索。
SQLite MCP Server 是一个企业级SQLite数据库增强工具,提供73个专用工具,支持高级分析、JSON操作、文本处理、向量搜索、地理空间操作和智能工作流自动化,具备AI原生JSON操作和增强安全性。
MCP服务端项目,用于连接Weaviate向量数据库,提供搜索和存储功能,支持通过Claude桌面应用配置开发环境。
该项目是一个基于Model Context Protocol (MCP)的服务器,实现了与Milvus向量数据库的无缝集成,为LLM应用提供标准化的数据访问接口。支持在Claude Desktop和Cursor等应用中直接调用Milvus的搜索、查询和管理功能。
一个提供电子邮件处理功能的MCP服务器,集成MongoDB语义搜索和SQLite高效存储,支持Outlook邮件处理、向量嵌入生成和多邮箱管理。