华盛顿大学与艾伦人工智能研究所发布开源AI模型OpenScholar,有效解决学术领域AI“编造论文”问题。该模型在整合前沿研究时表现突出,引文准确率显著提高,生成内容质量获过半人类专家认可。相比之下,GPT-4o等顶尖模型在学术引用上存在78%至90%的“幻觉”率。
百川智能推出Baichuan-M3 Plus医疗大模型,专为高可靠性医疗场景设计。该模型将“六源循证范式”融入训练与推理全流程,确保诊断建议、用药提示等均基于权威医学证据。其事实性幻觉率降至2.6%,相比GPT-5.2降低超30%,显著提升医疗AI的临床可信度。
百川智能发布Baichuan-M3Plus模型,在医疗问答准确性和可靠性上进一步提升,显著降低了幻觉率,刷新了行业纪录。
阿里健康发布自研医学大模型“氢离子”,主打低幻觉、高循证,所有回答均有权威出处并支持溯源,旨在成为医疗领域幻觉率最低的AI工具,目前已结束内测并向医生开放。
Alibaba
$1
输入tokens/百万
$10
输出tokens/百万
256
上下文长度
$15.8
$12.7
64
Bytedance
-
Openai
$8.75
$70
400
Iflytek
$2
$1.8
$5.4
16
Xai
Google
Baidu
32
$1.5
$4.5
128
$3
$9
1k
Huawei
$0.14
$0.28
131
$0.35
$0.7
Chatglm
stelterlab
DeepSeek-R1-0528是深度求索公司推出的升级版大语言模型,在推理能力、减少幻觉率等方面有显著提升,整体性能接近领先模型。
QuantTrio
基于DeepSeek-R1-0528-Qwen3-8B开发的量化版本模型,在推理能力、减少幻觉率等方面有显著提升,适用于多种自然语言处理任务。