Meta成立超级智能实验室,其首篇论文《REFRAG:Rethinking RAG based Decoding》提出新方法,显著提升大语言模型在检索增强生成任务中的推理速度,提升幅度达30倍以上,同时保持准确性不变。
检索增强生成(RAG)技术通过检索知识库信息提升大语言模型回答准确性,但处理语言多样性时存在不足。为此,Lexical Diversity-aware RAG 方法被提出,旨在优化模型对多样化表达的理解,增强生成答案的可靠性。
腾讯优图实验室开源图检索增强生成框架Youtu-GraphRAG,通过大语言模型+RAG模式将知识组织成图谱,提升复杂问答任务的准确性和可追溯性。适用于企业知识库、科研文档解析等知识密集型场景,创新实现从图构建到检索的全流程优化。
MaxKB是一款基于RAG技术的企业级AI智能体平台,在GitHub上获得数千星标和数万下载量。该平台通过检索增强生成技术构建企业知识库系统,支持智能客服和内部知识管理等应用场景,提供开源解决方案。
SkyPilot RAG 是一个基于 SkyPilot 的检索增强生成系统,用于处理大规模法律文档搜索和分析。
KET-RAG 是一个结合知识图谱的检索增强型生成框架,用于高效文档索引和答案生成。
wdoc 是一个强大的 RAG(检索增强生成)系统,用于处理和查询多种文件类型的文档。
一个为RAG(检索增强生成)AI助手设计的React组件,可快速集成到Next.js应用中。
cohere
$1.8
输入tokens/百万
$7.2
输出tokens/百万
128k
上下文长度
-
bartowski
这是LiquidAI的LFM2-1.2B-RAG模型的GGUF量化版本,专门为检索增强生成(RAG)任务优化。该模型经过多种量化处理,提供从bf16到Q2_K等多种量化级别,适用于不同硬件条件和性能需求。
anquachdev
Vi-Qwen2-7B-RAG 是一个专为检索增强生成(RAG)任务定制的大型语言模型,基于 Qwen2-7B-Instruct 在越南语数据集上微调而来,显著提升了越南语处理能力和 RAG 任务的执行效率。
AITeamVN
基于Qwen2.5-7B-Instruct微调的越南语检索增强生成(RAG)专用大模型,采用GRPO优化方法训练
XXsongLALA
Qwen-2.5-7B-base-RAG-RL 是一个基于未知数据集从头开始训练的7B参数规模的大语言模型,结合了检索增强生成(RAG)和强化学习(RL)技术。
PleIAs
Pleias-RAG-1B是一款12亿参数的小型推理模型,专为检索增强生成(RAG)、搜索和文献摘要任务设计。在多语言RAG任务中表现优异,支持结构化引证生成。
Pleias-RAG-350M是一款3.5亿参数的小型推理模型,专为检索增强生成(RAG)、搜索和来源摘要任务而训练。
Surromind
基于Qwen2.5-14B微调的韩语大语言模型,专注于RAG(检索增强生成)任务,能够生成包含来源引用的结构化回答。
TheFinAI
首个专为金融时间序列预测设计的检索器,基于检索增强生成(RAG)框架
FinSeer StockLLM 是一个开源的10亿参数大语言模型,专为金融时间序列预测设计,采用检索增强生成(RAG)框架。
silma-ai
SILMA Kashif 2B Instruct v1.0是专为阿拉伯语和英语RAG(检索增强生成)任务设计的开源模型,基于谷歌Gemma构建,具备实体提取和多领域处理能力。
openbmb
VisRAG是基于视觉语言模型(VLM)的检索增强生成(RAG)系统,可直接将文档作为图像进行嵌入表征,避免传统文本解析导致的信息损耗。
Vi-Qwen2-7B-RAG 是一个专为检索增强生成(RAG)任务定制的大语言模型,基于 Qwen2-7B-Instruct 基础模型在越南语数据集上微调而来,提升越南语处理能力和 RAG 任务执行效率。
belyakoff
基于meta-llama/Llama-3.2-3B-Instruct基础模型微调的文本生成模型,支持俄语和英语,专门针对代码生成、RAG(检索增强生成)和问答任务进行优化。
CohereLabs
Command R+ 08-2024 是一个1040亿参数的多语言大语言模型,支持检索增强生成(RAG)和工具使用,适用于复杂任务自动化。
Cohere实验室Command R 08-2024是一款320亿参数的高性能生成模型,支持多语言生成和检索增强生成(RAG)能力。
sujet-ai
Marsilia-Embeddings-FR-Base 是一款专为金融领域任务设计的法语嵌入模型,展示了在检索增强生成(RAG)应用中针对特定任务微调嵌入模型的重要性。
hiieu
专注于RAG(检索增强生成)和生产效率的越南语文本嵌入模型,基于intfloat/multilingual-e5-base微调
myrkur
这是一个基于波斯语BERT模型微调的句子转换器模型,专为增强检索增强生成(RAG)系统设计,能够高效检索上下文相关信息。
sinjy1203
该模型是基于EEVE-韩语指导-10.8B-v1.0微调的,用于评估RAG(检索增强生成)中针对问题的检索上下文是否正确,并以'是'或'否'回答。
cypienai
Cymist2-v0.1是由Cypien AI团队开发的先进语言模型,专为土耳其语和英语的文本生成任务优化,支持检索增强生成(RAG)和监督微调(SFT)。
本项目构建了一个基于IBM Watsonx.ai的检索增强生成(RAG)服务器,使用ChromaDB进行向量索引,并通过模型上下文协议(MCP)暴露接口。该系统能够处理PDF文档并基于文档内容回答问题,实现了将大型语言模型与特定领域知识相结合的智能问答功能。
该项目实现了一个MCP服务器和客户端,用于构建基于检索增强生成(RAG)的智能代理应用。服务器提供实体提取、查询优化和相关性检查等工具,客户端展示如何连接服务器并使用这些工具来增强RAG系统的性能。
一个基于Model Context Protocol (MCP)的服务端,提供检索增强生成(RAG)能力,集成Cursor IDE和Claude Desktop等客户端,实现领域知识问答、智能检索和上下文感知的响应生成。
MCP RAG Server是一个基于Model Context Protocol的检索增强生成服务,通过本地化工具(ChromaDB和Ollama)自动索引项目文档,为连接的LLM提供上下文增强能力。
基于检索增强生成(RAG)的Godot文档查询助手,通过向量化技术和语义搜索实现智能问答
一个基于Model Context Protocol (MCP)的服务端项目,提供检索增强生成(RAG)能力,可作为Cursor IDE和Claude Desktop等客户端与Contextual AI代理的桥梁,实现基于知识库的智能问答和上下文感知响应。
Apple RAG MCP是一个为AI代理提供苹果开发专业知识的检索增强生成系统,集成了官方Swift文档、设计指南和Apple Developer YouTube内容,通过AI驱动的混合搜索技术提供准确的技术答案。
mcp-rag-server是一个基于Model Context Protocol (MCP)的服务,支持检索增强生成(RAG),能够索引文档并为大型语言模型提供相关上下文。
一个基于检索增强生成(RAG)的日记系统,支持按日期和主题组织日记,并提供语义搜索功能,可与AI代理连接增强交互。
该项目实现了一个基于FAISS向量数据库的MCP服务器,支持检索增强生成(RAG)功能,包含GitHub文件下载、文档索引、本地查询和LLM集成等完整工作流。
一个基于TypeScript的MCP服务器,实现本地文档的检索增强生成(RAG)系统,支持Git仓库和文本文件的查询与索引。
Vectara MCP是一个基于Model Context Protocol的开源项目,为AI系统提供与Vectara的RAG平台无缝对接的能力,支持快速可靠的检索增强生成功能。
MCP Apple Notes是一个基于Model Context Protocol的服务,能够对Apple Notes进行语义搜索和检索增强生成(RAG),使AI助手如Claude能在对话中引用用户的笔记。
一个基于Python的文档处理与检索增强生成(RAG)服务器,使用DuckDB数据库存储嵌入向量,支持多种文件格式处理并提供Web界面和API接口。
rag-mcp是一个过度设计的检索增强生成系统,通过Python服务器提供多种文本搜索模式(语义搜索、问答搜索、风格搜索),使用PostgreSQL和pgvector存储文本嵌入向量,支持与AI代理交互,架构复杂但可扩展。
RAG文档MCP服务器是一个基于向量搜索的文档处理工具,为AI助手提供文档检索和上下文增强功能。
该项目演示了如何实现一个支持检索增强生成(RAG)的模型上下文协议(MCP)服务器,提供知识库交互、信息检索和文档管理功能。
mcp-rag-server是一个基于Model Context Protocol(MCP)的检索增强生成(RAG)服务器,通过索引项目文档为连接的LLM提供相关上下文。它使用ChromaDB和Ollama实现本地化存储和嵌入生成,支持多种文件格式,并可通过Docker快速部署。
一个研究检索增强生成(RAG)与多云处理(MCP)服务器集成的开源项目,聚焦免费模型在商业软件中的应用,提供模块化学习路径和实践案例。
该项目实现了一个基于MCP协议的服务器,集成FAISS向量数据库和RAG技术,支持从GitHub提取Move文件并构建知识库,提供文档检索和增强生成功能。