最好的rag AI工具模型_精选rag资讯

AI资讯

Google 推出 Gemini API 文件搜索工具:简化私有 RAG 集成，开发者无需自建向量数据库

Google推出Gemini API的“文件搜索工具”，作为全托管RAG系统，可将私有文件直接转化为知识库。用户无需处理数据分块、嵌入生成等步骤，通过API即可实现高效检索与生成。工具核心是端到端集成，自动完成文件上传、索引和检索流程。

9.6k 1 小时前

Google 推出 Gemini API 文件搜索工具:简化私有 RAG 集成，开发者无需自建向量数据库

Meta超级智能实验室突破RAG技术瓶颈：REFRAG框架让推理速度飙升30倍

Meta超级智能实验室推出REFRAG技术，使大型语言模型在检索增强生成任务中的推理速度提升超过30倍。这项突破性成果发表于相关论文，深刻变革AI模型运作方式。该实验室今年6月在加州成立，源于扎克伯格对Llama4模型的重视。

9.2k 21 小时前

Meta 超级智能实验室推出新技术，使大模型 RAG 推理速度提升 30 倍

Meta成立超级智能实验室，其首篇论文《REFRAG:Rethinking RAG based Decoding》提出新方法，显著提升大语言模型在检索增强生成任务中的推理速度，提升幅度达30倍以上，同时保持准确性不变。

15.7k 4 小时前

超越 RAG，DRAG 技术显著提升大模型的准确性

检索增强生成(RAG)技术通过检索知识库信息提升大语言模型回答准确性，但处理语言多样性时存在不足。为此，Lexical Diversity-aware RAG 方法被提出，旨在优化模型对多样化表达的理解，增强生成答案的可靠性。

11.1k 2 天前

AI产品

SQLBot

SQLBot 是一款基于大模型和 RAG 的智能问数系统。

数据分析

6.6k

Ducky

全面管理的AI搜索基础设施，支持RAG。

AI搜索

5.3k

RLAMA

一个强大的本地文档问答工具，连接到你的本地Ollama模型，用于创建和管理RAG系统。

知识管理

9.6k

RagaAI

RagaAI Catalyst 是一个用于观察、评估和调试 AI 代理的平台，助力开发者优化 AI 工作流并安全部署。

开发与工具

10.7k

模型

Llama 3.3 Nemotron Super 49B v1 (Reasoning)

nvidia

输入tokens/百万

输出tokens/百万

128k

上下文长度

Llama 3.3 Nemotron Super 49B v1

nvidia

输入tokens/百万

输出tokens/百万

128k

上下文长度

Jamba 1.7 Large

ai21-labs

$3.53

输入tokens/百万

$7.99

输出tokens/百万

260k

上下文长度

Command-R+ (Aug '24)

cohere

$1.8

输入tokens/百万

$7.2

输出tokens/百万

128k

上下文长度

Command-R+ (Apr '24)

cohere

$1.8

输入tokens/百万

$7.2

输出tokens/百万

128k

上下文长度

Command-R (Aug '24)

cohere

输入tokens/百万

输出tokens/百万

128k

上下文长度

Command-R (Mar '24)

cohere

输入tokens/百万

输出tokens/百万

128k

上下文长度

MCP

Crawl4AI RAG

Crawl4AI RAG MCP Server是一个集成网络爬虫和RAG功能的AI代理服务，支持智能URL检测、递归爬取、并行处理和向量搜索，旨在为AI编码助手提供强大的知识获取和检索能力。

python

7.6k

3.5分

Mcp Apple Notes

一个基于MCP协议的本地服务器，实现Apple Notes的语义搜索和RAG功能，供Claude等AI助手调用

typescript

10.1k

3.5分

Mcp Server Rag Web Browser

为RAG Web Browser Actor实现的MCP服务器，支持AI代理进行网页搜索和内容提取。

typescript

9.3k

3.0分

RAG Docs

一个基于Qdrant向量数据库的文档语义搜索服务，支持URL和本地文件导入，提供自然语言查询功能。

typescript

9.7k

3.0分

Mcp Usecase

Quick-start Auto MCP是一个帮助用户快速在Claude Desktop和Cursor中注册Anthropic模型上下文协议(MCP)的工具，提供RAG文档搜索、Dify工作流、实时网络搜索等功能，支持一键生成JSON配置文件。

python

6.2k

3.0分

RagRabbit

RagRabbit是一个自托管的AI站点搜索和LLM.txt生成工具，支持一键部署在Vercel上。

typescript

14.1k

3.0分

AgenticMCP_rag

基于MCP服务器的RAG项目

python

5.7k

2.5分

Mcp Agentic Rag

该项目实现了一个MCP服务器和客户端，用于构建基于检索增强生成（RAG）的智能代理应用。服务器提供实体提取、查询优化和相关性检查等工具，客户端展示如何连接服务器并使用这些工具来增强RAG系统的性能。

python

2.5分

Watsonx Rag Mcp Server

本项目构建了一个基于IBM Watsonx.ai的检索增强生成(RAG)服务器，使用ChromaDB进行向量索引，并通过模型上下文协议(MCP)暴露接口。该系统能够处理PDF文档并基于文档内容回答问题，实现了将大型语言模型与特定领域知识相结合的智能问答功能。

python

9.7k

2.5分

Root Signals Mcp

Root Signals MCP服务器是一个将Root Signals评估工具通过Model Context Protocol（MCP）暴露给AI助手和代理的桥梁项目，支持标准评估和带上下文的RAG评估。

python

6.4k

2.5分

Rag Server Mcp

MCP RAG Server是一个基于Model Context Protocol的检索增强生成服务，通过本地化工具（ChromaDB和Ollama）自动索引项目文档，为连接的LLM提供上下文增强能力。

typescript

7.4k

2.5分

DuckDB RAG MCP Sample

一个使用DuckDB和Plamo-Embedding-1B实现RAG功能的项目，支持markdown文件向量化存储和检索，并提供MCP服务接口。

python

6.8k

2.5分

Nccn_guidelines_mcp

一个基于模型上下文协议(MCP)的服务器，提供美国国家综合癌症网络(NCCN)临床指南的访问服务。该系统通过直接读取指南PDF内容而非使用RAG技术，确保医疗指导的准确性和可靠性。

python

4.3k

2.5分

Fastmcp Godot Rag

基于检索增强生成(RAG)的Godot文档查询助手，通过向量化技术和语义搜索实现智能问答

python

6.5k

2.5分

Contextual Mcp Server

一个基于Model Context Protocol (MCP)的服务端，提供检索增强生成(RAG)能力，集成Cursor IDE和Claude Desktop等客户端，实现领域知识问答、智能检索和上下文感知的响应生成。

python

8.7k

2.5分

Sample Model Context Protocol Demos

该项目提供了一系列使用AWS Model Context Protocol（MCP）的示例模块，涵盖了多种语言和技术栈，包括TypeScript、Python、Spring AI等，展示了MCP在客户端-服务器通信、ECS部署、RAG集成等场景下的应用。

typescript

31.1k

2.5分

Mcp Rag Server

mcp-rag-server是一个基于Model Context Protocol (MCP)的服务，支持检索增强生成(RAG)，能够索引文档并为大型语言模型提供相关上下文。

typescript

2.5分

Contextual Mcp Server

一个基于Model Context Protocol (MCP)的服务端项目，提供检索增强生成(RAG)能力，可作为Cursor IDE和Claude Desktop等客户端与Contextual AI代理的桥梁，实现基于知识库的智能问答和上下文感知响应。

python

19.1k

2.5分

Apple Rag Mcp

Apple RAG MCP是一个为AI代理提供苹果开发专业知识的检索增强生成系统，集成了官方Swift文档、设计指南和Apple Developer YouTube内容，通过AI驱动的混合搜索技术提供准确的技术答案。

typescript

7.2k

2.5分

HR Policy Chatbot

该项目构建了一个基于RAG的HR聊天机器人，通过MCP服务器作为功能调用中心，实现PDF文档上传、解析、检索及自然语言问答功能。

智启未来，您的人工智能解决方案智库

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

商务合作网站地图

AI资讯

Google 推出 Gemini API 文件搜索工具:简化私有 RAG 集成，开发者无需自建向量数据库

Meta超级智能实验室突破RAG技术瓶颈：REFRAG框架让推理速度飙升30倍

Meta 超级智能实验室推出新技术，使大模型 RAG 推理速度提升 30 倍

​超越 RAG，DRAG 技术显著提升大模型的准确性

AI产品

SQLBot

Ducky

RLAMA

RagaAI

模型

Llama 3.3 Nemotron Super 49B v1 (Reasoning)

Llama 3.3 Nemotron Super 49B v1

Jamba 1.7 Large

Command-R+ (Aug '24)

Command-R+ (Apr '24)

Command-R (Aug '24)

Command-R (Mar '24)

Chonky_distilbert_base_uncased_1.1

LiquidAI_LFM2 1.2B RAG GGUF

Qwen3 14B FP4

Vi Qwen2 7B RAG GGUF

Mdbr Leaf Ir

Llama 3_3 Nemotron Super 49B V1_5 AWQ 4bit

Qwen3 30B A3B FP4

Llama 3.1 Nemotron Nano 4B V1.1 GGUF

Japanese Reranker Tiny V2

Japanese Reranker Xsmall V2

Fine Tuned_movie_retriever Bge Base En V1.5

Blip Histopathology Finetuned

GRPO VI Qwen2 7B RAG

Chonky_modernbert_large_1

Anubis 559M

Saanvi C0 12B

Qwen 2.5 7B Base RAG RL

Chonky_modernbert_base_1

Chonky_distilbert_base_uncased_1

Pleias RAG 1B

MCP

Crawl4AI RAG

Mcp Apple Notes

Mcp Server Rag Web Browser

RAG Docs

Mcp Usecase

RagRabbit

AgenticMCP_rag

Mcp Agentic Rag

Watsonx Rag Mcp Server

Root Signals Mcp

Rag Server Mcp

DuckDB RAG MCP Sample

Nccn_guidelines_mcp

Fastmcp Godot Rag

Contextual Mcp Server

Sample Model Context Protocol Demos

Mcp Rag Server

Contextual Mcp Server

Apple Rag Mcp

HR Policy Chatbot

超越 RAG，DRAG 技术显著提升大模型的准确性