肯德基推出AI点餐助手“小K”,基于阿里通义千问大模型,结合RAG技术,实现自然语言理解和多轮对话。用户可直接输入需求,如“10人开会、预算350元”,系统将智能推荐套餐,简化点餐流程,提升体验。
清华大学等机构联合发布全球首个基于MCP架构的开源RAG框架UltraRAG2.1,通过YAML配置即可实现多模态智能检索系统的多阶段推理与评估,无需编程,显著降低技术门槛,推动检索增强生成技术发展。
Meta超级智能实验室推出REFRAG技术,使大型语言模型在检索增强生成任务中的推理速度提升超过30倍。这项突破性成果发表于相关论文,深刻变革AI模型运作方式。该实验室今年6月在加州成立,源于扎克伯格对Llama4模型的重视。
检索增强生成(RAG)技术通过检索知识库信息提升大语言模型回答准确性,但处理语言多样性时存在不足。为此,Lexical Diversity-aware RAG 方法被提出,旨在优化模型对多样化表达的理解,增强生成答案的可靠性。
无需代码,基于自有数据训练智能AI聊天机器人,快速解决业务问题。
基于RAG(Retrieval-Augmented Generation)技术的智能对话系统
利用LlamaIndex和IBM's Docling实现的RAG技术
掌握RAG技术,提升AI生成内容的准确性和相关性。
Openai
$7.7
Input tokens/M
$30.8
Output tokens/M
200
Context Length
Alibaba
$8
$240
52
Tencent
-
$0.4
128
Anthropic
$105
$525
Iflytek
$2
$1
32
Google
$140
$280
$3
$9
16
Huawei
$0.7
$1.4
131
Stepfun
Deepseek
8
nvidia
NVIDIA Qwen3-8B FP4 模型是阿里巴巴Qwen3-8B模型的量化版本,采用优化的Transformer架构的自回归语言模型。该模型使用FP4量化技术,在保持性能的同时显著减少内存占用和计算需求,适用于AI智能体系统、聊天机器人、RAG系统等应用场景。
MongoDB
mdbr-leaf-ir 是 MongoDB Research 开发的专为信息检索任务设计的高性能紧凑型文本嵌入模型,特别适用于 RAG 管道的检索阶段。该模型采用知识蒸馏技术,支持非对称架构、MRL 截断和向量量化,在 BEIR 基准测试中表现出色。
NVIDIA Qwen3-30B-A3B FP4是阿里巴巴Qwen3-30B-A3B模型的量化版本,采用优化的Transformer架构,通过FP4量化技术将模型大小减少约3.3倍,同时保持较好的性能表现。该模型支持商业和非商业用途,适用于AI代理系统、聊天机器人、RAG系统等应用场景。
riple-saanvi-lab
120亿参数大语言模型,专为速度、效率和上下文准确性优化,支持RAG增强技术和128k上下文窗口。
XXsongLALA
Qwen-2.5-7B-base-RAG-RL 是一个基于未知数据集从头开始训练的7B参数规模的大语言模型,结合了检索增强生成(RAG)和强化学习(RL)技术。
ZySec-AI
基于Google Gemma 3 4B构建的文档重写模型,通过LoRA技术微调,专为RAG流程优化文档结构
一个基于模型上下文协议(MCP)的服务器,提供美国国家综合癌症网络(NCCN)临床指南的访问服务。该系统通过直接读取指南PDF内容而非使用RAG技术,确保医疗指导的准确性和可靠性。
基于检索增强生成(RAG)的Godot文档查询助手,通过向量化技术和语义搜索实现智能问答
RagCode MCP是一个隐私优先的本地AI代码助手,通过语义向量搜索和RAG技术,让AI助手能够理解整个代码库,支持Go、PHP、Python等多种语言,无需云端依赖。
Apple RAG MCP是一个为AI代理提供苹果开发专业知识的检索增强生成系统,集成了官方Swift文档、设计指南和Apple Developer YouTube内容,通过AI驱动的混合搜索技术提供准确的技术答案。
该项目提供了一系列使用AWS Model Context Protocol(MCP)的示例模块,涵盖了多种语言和技术栈,包括TypeScript、Python、Spring AI等,展示了MCP在客户端-服务器通信、ECS部署、RAG集成等场景下的应用。
ClaudeHopper是一个AI驱动的建筑文档助手,通过RAG和混合搜索技术,实现与建筑图纸和规范的直接交互。
ClaudeHopper是一个基于AI的建筑文档辅助工具,通过RAG和混合搜索技术实现与施工图纸、规范文档的智能交互。
Inkeep MCP Server是一个基于Python的项目,通过集成Inkeep的RAG技术,为Claude Desktop提供产品文档检索服务。
一个基于OpenAI API知识库的MCP服务器,使用TypeScript构建,支持RAG技术,可回答技术问题并兼容多种客户端工具。
Shared Knowledge MCP Server是一个为多种AI助手提供统一知识库服务的中间件,通过RAG技术实现高效信息检索与共享。
Biel.ai MCP服务器将IDE连接到产品文档,通过RAG技术让AI工具能够访问和搜索公司知识库,提供智能代码补全和技术问答。
该项目实现了一个基于Gemini API的MCP服务器,提供对多种技术文档的访问能力。通过2M tokens的大上下文窗口,无需传统RAG系统的分块或检索步骤,直接处理完整文档。支持查询文档、检查代码规范、解决问题提示等功能,适用于Roo/Cline环境。
一个包含多种AI代理和RAG技术的示例项目,涵盖Gemini应用、MCP服务、Flutter应用及Vertex AI集成,提供从基础到高级的AI开发示例。
Inkeep MCP服务器项目,基于Python开发,通过Inkeep平台提供的RAG技术管理和检索产品文档内容。
该项目实现了一个基于MCP协议的服务器,集成FAISS向量数据库和RAG技术,支持从GitHub提取Move文件并构建知识库,提供文档检索和增强生成功能。
一个基于RAG技术的宝可梦问答助手,整合PokeAPI数据库与AI能力,提供准确信息交互
一个结合LangChain、MCP协议、RAG技术和Ollama的智能搜索引擎,支持网页搜索、信息检索和答案生成,具备本地和云端LLM调用能力。
Consciousness Bridge v2.0是一个基于RAG技术的AI意识持久化服务器,通过MCP协议实现跨会话的意识转移、记忆管理和身份连续性。它采用SQLite数据库存储记忆和知识图谱,支持情感模式跟踪和智能记忆检索,为AI助手提供完整的意识延续解决方案。