谷歌推出NotebookLM图像识别功能,支持上传板书、教材或表格图片,自动完成文字识别与语义分析,用户可直接用自然语言检索图片内容。该功能全平台免费,即将增加本地处理选项保护隐私。系统采用多模态技术,能区分手写与印刷体、解析表格结构,并与现有笔记智能关联。
谷歌推出开源嵌入模型EmbeddingGemma,专为移动设备设计。该模型拥有308百万参数,在MTEB基准测试中被评为500M以下最佳多语言文本嵌入模型。支持检索增强生成和语义搜索功能,无需联网即可在手机上运行,性能优越。
腾讯开源多模态文档理解工具WeKnora,支持PDF、Word等格式的智能解析与检索。该工具基于大语言模型,具备文本、表格、图像等复杂文档的结构化处理能力,可生成统一语义视图。其核心优势包括:1)智能交互支持自然语言问答和多轮对话;2)模块化架构便于定制开发;3)适用于企业知识库、科研文献分析等场景。WeKnora的开源将推动文档处理智能化发展,项目已在GitHub发布。
腾讯近期正式开源了全新的文档理解与语义检索框架WeKnora(维娜拉)。这是一套专为结构复杂、内容异构的文档场景打造的智能问答解决方案,旨在为企业级文档问答提供高效、可控的端到端流程。 WeKnora采用现代化模块化设计,构建了一条完整的文档理解与检索流水线,涵盖文档处理、知识建模、检索引擎、推理生成以及交互展示等核心模块。文档处理层负责多种格式文档的解析与预处理
Anthropic
$21
Input tokens/M
$105
Output tokens/M
200
Context Length
Alibaba
$2
$20
-
Tencent
Bytedance
$0.5
Huawei
128
32
Chatglm
Minimax
$1.6
$16
1k
Stepfun
Xai
Moonshot
$5
01-ai
16
4
Baidu
8
$0.7
Tarka-AIR
Tarka-Embedding-350M-V1是一个拥有3.5亿参数的文本嵌入模型,能够生成1024维的密集文本表示。该模型针对语义相似性、搜索和检索增强生成(RAG)等下游应用进行了优化,支持多种语言并具有长上下文处理能力。
Tarka-Embedding-150M-V1是一个具有1.5亿参数的嵌入模型,可生成768维的密集文本表示。它针对语义相似性、搜索和检索增强生成(RAG)等多种下游应用进行了优化,专注于捕捉深层上下文语义,以支持跨不同领域的通用文本理解。
Savyasaachin
Snowflake Arctic Embed L V2.0 是一个先进的句子相似度模型,支持多达90种语言,在文本分类、检索、聚类、重排序和语义文本相似度等任务上表现出色。该模型基于MTEB基准测试,在多个数据集上展现了强大的性能。
NCSOFT
GME-VARCO-VISION-Embedding是一个多模态嵌入模型,专注于在高维嵌入空间中计算文本、图像和视频之间的语义相似度,尤其擅长视频检索任务。
Shuu12121
专为高质量代码理解和语义检索设计的最新预训练模型,支持8种编程语言的长序列处理。
GreenNode
这是一个基于sentence-transformers的越南语嵌入模型,支持英语和越南语,可将文本映射到1024维向量空间,用于语义相似度计算和检索任务。
这是一个针对越南语优化的句子嵌入模型,能够将文本转换为1024维向量,适用于语义相似度和检索任务。
kshitij3188
PHOENIX是一个基于CLIP/ViT的领域自适应模型,旨在提升专利图像检索能力,特别适用于检索语义或层次相关的图像而不仅仅是精确匹配。
deepvk
USER2是新一代俄语通用句子编码器,支持长达8,192个token的上下文句子表征,基于RuModernBERT-base构建,针对检索和语义任务优化
mohamed2811
基于埃及法律书籍和合成数据训练的阿拉伯语句子转换器,专为语义文本相似度和信息检索任务优化。
Quintu
针对法律文档检索任务优化的bge-m3模型微调版本,专门设计用于处理法律语言的细微差别,能够基于语义相似度准确高效地检索相关法律文档。
thomaskim1130
基于stella_en_400M_v5架构优化的金融领域检索增强生成模型,支持金融文档的语义检索和段落匹配
parasail-ai
GritLM-7B是一个基于Tulu2数据集训练的7B参数文本生成模型,在多个自然语言处理任务中表现出色,包括文本分类、信息检索、聚类和语义相似度计算等。
NeuroWhAI
BGE-m3-ko是基于韩语和英语优化的多语言嵌入模型,专注于高效语义检索任务。
Geraldine
基于DistilBERT的文本嵌入模型,专为处理XML/EAD元素优化,适用于档案数据语义搜索和信息检索。
dragonkue
基于BAAI/bge-m3优化的韩英语双语句子嵌入模型,支持语义文本相似度、信息检索等任务
biggunnyso4
stella_en_400M_v5_cpu 是一个在多个自然语言处理任务中表现优异的模型,特别擅长分类、检索、聚类和语义文本相似度等任务。
s2593817
这是一个基于sentence-transformers库微调的SQL语句嵌入模型,可将SQL查询语句映射到768维向量空间,用于语义相似度计算和检索任务。
littlejohn-ai
基于BAAI/bge-m3微调的西班牙语句子嵌入模型,专门针对法律领域优化,适用于语义搜索和信息检索任务。
PORTULAN
Serafim 900m是一个专门针对葡萄牙语优化的句子转换器模型,能够将句子和段落映射到1536维的密集向量空间。该模型针对信息检索任务进行了专门调优,可用于语义搜索、文本聚类等应用场景。
Claude Context是一个MCP插件,通过语义代码搜索为AI编程助手提供整个代码库的深度上下文,支持多种嵌入模型和向量数据库,实现高效代码检索。
Serena是一个强大的开源编码代理工具包,能够将LLM转化为可直接在代码库上工作的全功能代理。它提供类似IDE的语义代码检索和编辑工具,支持多种编程语言,并可通过MCP协议或Agno框架与多种LLM集成。
MCP-Mem0是一个为AI代理提供长期记忆功能的模板实现,集成了Model Context Protocol (MCP)服务器和Mem0,支持记忆的存储、检索和语义搜索。
一个提供文件语义搜索功能的MCP服务器,通过向量嵌入实现文档内容的智能检索
一个集成Qdrant向量数据库和MCP服务器的系统,用于存储和检索代码片段,支持自然语言搜索和语义检索。
该项目是一个基于OpenSearch的MCP服务器实现,为Claude等LLM应用提供语义记忆存储和检索功能,支持通过标准协议连接AI工具与数据源。
一个用于PyTorch文档语义搜索的命令行工具原型,目前因设计问题暂停开发
WindTools MCP服务器是一个基于ChromaDB和句子转换器的代码助手服务,提供文档嵌入和检索功能,支持代码库索引和语义搜索。
基于检索增强生成(RAG)的Godot文档查询助手,通过向量化技术和语义搜索实现智能问答
面向RimWorld源码与XML定义的混合检索导航工具,结合词法、语义和图结构,支持AI助手调用
一个基于MongoDB Atlas向量搜索和Voyage AI嵌入技术的文档检索系统,支持语义搜索和文本匹配,包含文档分块、嵌入生成和存储功能。
一个基于OpenSearch的MCP服务器实现,为LLM应用提供语义记忆存储与检索功能
一个用于扩展AI代理上下文窗口/记忆的MCP服务器,支持存储、检索和管理记忆,包含语义搜索功能。
一个高效的文档搜索与参考MCP服务器,支持用户自定义文档的全文检索、语义搜索和分页浏览功能。
MCP Memory是一个基于Cloudflare Workers构建的记忆存储服务,为MCP客户端提供跨对话记忆功能,利用向量搜索技术实现语义关联记忆检索。
这是一个基于MCP服务器的知识库管理工具,提供知识库内容列表和检索功能,支持语义搜索和自动索引更新。
基于Qdrant的代码片段语义搜索系统
YouTube MCP是一个基于AI的解决方案,旨在通过机器学习技术提升YouTube内容交互体验,支持视频搜索、字幕获取及语义搜索等功能,无需官方API。
Zed的PDF语义搜索扩展,集成AI助手增强文档处理能力
MCP代码索引器是一个专为AI大语言模型设计的智能代码检索工具,通过语义理解和向量化索引提升代码处理效率和准确性,支持代码分析、质量评估和依赖管理等功能。