英国西米德兰兹警方因依赖微软AI助手Copilot生成的虚假信息做出错误决策,陷入信任危机。代理警察局长已宣布紧急停用该工具。此前,警方曾建议禁止以色列球队球迷观赛,调查发现该决定部分基于Copilot提供的不实情报。
杭州互联网法院近日判决全国首例生成式AI“幻觉”侵权案,认定AI平台已尽合理注意义务,无主观过错,驳回原告诉求。案件源于用户查询高校信息时,AI提供错误地址并坚称属实。
百川智能推出Baichuan-M3 Plus医疗大模型,专为高可靠性医疗场景设计。该模型将“六源循证范式”融入训练与推理全流程,确保诊断建议、用药提示等均基于权威医学证据。其事实性幻觉率降至2.6%,相比GPT-5.2降低超30%,显著提升医疗AI的临床可信度。
百川智能发布Baichuan-M3Plus模型,在医疗问答准确性和可靠性上进一步提升,显著降低了幻觉率,刷新了行业纪录。
消除幻觉,多模态RAG不忘信息,智能编排前沿模型,任务表现卓越
用沁言【文献检索重磅上线】2亿文献便携检索,拒绝AI幻觉,即查即存即分析~
Basin是一款可靠性的编码工具,旨在防止AI生成的错误和幻觉。
一个用于比较大型语言模型在总结短文档时产生幻觉的排行榜。
Alibaba
$15.8
Input tokens/M
$12.7
Output tokens/M
64
Context Length
Openai
$8.75
$70
400
Iflytek
$2
-
$525
$1050
128
Baichuan
$15
32
cpatonn
Qwen3-Omni-30B-A3B-Captioner是基于Qwen3-Omni-30B-A3B-Instruct微调得到的细粒度音频分析模型,专门为任意音频输入生成详细且低幻觉的描述,在复杂多样的音频场景中表现出色。
openchs
这是一个基于Helsinki-NLP的opus-mt-mul-en模型进行微调的斯瓦希里语-英语翻译模型。该模型专门针对儿童热线服务场景进行了优化训练,采用合成的热线对话数据进行训练,具备防止生成幻觉的机制,并通过早停策略监控BLEU分数来保证翻译质量。
nightmedia
Qwen3-Next-80B-A3B-Instruct-q2-mlx是基于Qwen3-Next-80B-A3B-Instruct模型转换的MLX格式极端量化版本,主要用于文本生成任务。该版本采用q2量化,模型大小约为23GB,作为概念验证版本,可能存在重复和幻觉问题。
HugoHE
M-Hood 是一系列专门设计用于缓解目标检测中幻觉现象的模型,通过新颖的微调策略和修正的基准数据集,显著减少分布外数据上的误报,提升目标检测系统的安全性和可靠性。
stelterlab
DeepSeek-R1-0528是深度求索公司推出的升级版大语言模型,在推理能力、减少幻觉率等方面有显著提升,整体性能接近领先模型。
QuantTrio
基于DeepSeek-R1-0528-Qwen3-8B开发的量化版本模型,在推理能力、减少幻觉率等方面有显著提升,适用于多种自然语言处理任务。
Inpris
Humains-Junior是由Humains.com基于微软Phi-3.5-mini-instruct模型训练的AI助手,专门针对客户服务场景优化。该模型使用3亿个标记进行微调,具备严格的指令遵循能力、减少幻觉现象和强大的功能调用能力,并实现了身份感知。
grounded-ai
该模型用于检测语言模型输出中的幻觉现象,即响应连贯但事实错误或脱离上下文的情况。
TEEN-D
基于Llama-3.2-3B-Instruct微调的声明验证模型,专门用于检测AI生成文本中的幻觉或未支持的陈述。
5CD-AI
Vintern-3B-R-beta是一个多模态大语言模型,专注于基于图像的复杂推理任务,能分解推理步骤并有效控制幻觉现象。
DISLab
Gen-8B-R2是一个专注于减少RAG系统中幻觉问题的生成模型,特别适用于处理检索噪声和信息过载的情况。
MichielPronk
该模型专门为SemEval 2025 Task3: Mu-SHROOM竞赛任务微调,用于识别大语言模型输出中的幻觉文本片段。
yaxili96
FactCG是一个基于DeBERTa-v3-large架构的文本分类模型,专门用于检测大型语言模型生成内容中的无依据幻觉。
KRLabsOrg
LettuceDetect 是一个基于 ModernBERT 的幻觉检测模型,专为 RAG 应用设计,支持长上下文处理。
LettuceDetect 是一个基于 ModernBERT 的幻觉检测模型,专为 RAG 应用设计,能够识别答案中未被上下文支持的词元。
SeaLLMs
SeaLLMs-v3是面向东南亚语言的大语言模型系列的最新成果,在同规模模型中表现卓越,能有效处理多种东南亚语言任务,提供安全可靠的响应。该模型经过特别优化,减少了幻觉现象,并对当地语境具有敏感性。
SeaLLMs-v3是面向东南亚语言的大语言模型系列的最新版本,在同类规模模型中取得最先进的性能,在世界知识、数学推理、翻译和指令遵循等任务中表现出色,特别优化了可靠性和安全性,减少幻觉现象。
gokaygokay
基于PaliGemma-3b模型在DocCI数据集上微调的图像描述生成模型,能生成200-350字符的详细描述文本,减少幻觉现象
TroyDoesAI
基于microsoft/Phi-3-mini-128k-instruct优化的模型,专注于提升上下文遵循能力和减少幻觉现象,适用于RAG应用场景。
blueapple8259
该模型使用韩国教材数据集tiny-textbooks进行训练,性能表现欠佳且存在严重幻觉现象
Cognee是一个为AI代理提供记忆功能的开源项目,通过模块化ECL管道构建动态知识图谱,支持多种数据源和格式,减少幻觉并降低成本。
一个基于MCP协议的开发文档服务器,提供文档爬取、本地加载、精准搜索和详情获取功能,解决AI开发中的文档幻觉问题。
一个防止AI幻觉的MCP服务,当AI不确定时可以向人类提问而非盲目自信,通过简单的问答机制提升开发效率。
FOCUS DATA MCP Server是一个将自然语言转换为SQL语句的AI助手服务,采用两步生成方案控制LLM幻觉,提升非技术用户对SQL结果的信任度。
一个基于MCP协议的开发文档服务器,提供精准的框架文档检索服务,解决AI开发中的API幻觉问题。
libragen是一个本地化RAG库构建工具,用于将AI助手(如Claude)与您的实际文档和代码库进行连接,通过创建可搜索的知识库来减少AI幻觉,支持从本地文件或Git仓库构建,并通过MCP协议直接集成到AI工作流中。
NotebookLM MCP服务器的安全强化版本,提供零幻觉答案、Gemini深度研究、文档API和程序化笔记本创建功能,具备14层企业级安全防护,包括后量子加密、证书固定和合规支持。
MCP-NixOS是一个防止AI助手对NixOS系统产生幻觉的模型上下文协议服务器,提供NixOS软件包、系统选项、Home Manager设置和nix-darwin配置的实时访问。
一个基于两阶段SQL生成的MCP服务器,通过自然语言转换SQL,降低幻觉风险并提升非技术用户信任度。
基于MCP协议的Java类分析服务,通过反编译依赖JAR包为LLM提供准确的代码分析能力,解决AI编码中的依赖幻觉问题
RagAlgo是一个为AI代理提供经过数学评分的金融上下文(韩国股票/加密货币)的MCP服务器,专注于使用每日收盘数据构建“事实状态”,以防止实时市场噪音导致的AI幻觉,旨在构建投资顾问而非高频交易机器人。
GitMCP是一个免费开源的远程MCP服务器,可将任何GitHub项目转化为文档中心,使AI工具能够访问最新文档和代码,减少幻觉。