维基百科联合创始人吉米·威尔士直言,当前AI的“幻觉”问题依旧严重,看似自信却常输出虚假信息,尚不可信,因此禁止其直接编辑词条。但他认为AI可作为“闹钟”发挥提醒辅助作用。
5月20日,四川南部县女子王某某利用AI大模型生成约3000字不实股市文章,在今日头条捏造A股行情预测、歪曲监管政策,以制造热点博流量。该行为扰乱金融市场秩序,遭警方行政处罚,虚假内容均下架。
本文揭露不法分子为博流量,滥用AI技术编造虚假新闻,严重扰乱网络秩序。以上海地铁站墙皮脱落事件为例,意外本无伤亡且已修复,但外省孙某见到消息后偷梁换柱,用AI炮制恐慌内容,凸显信息造假风险。
抖音生活服务5月27日公布年度数据:通过技术升级和专项治理,平台在内容生态净化与消费权益保障上取得显著成效。低质内容与虚假信息大幅减少,算法优化有效提升了用户体验,助力本地生活业务健康发展。
最强大的AI事实核查工具
VerificAudio是PRISA Media的人工智能工具,用于打击音频内容中的虚假信息(deep fakes)
AI生成的图像水印和识别工具。
AI生成内容辨别工具
Baidu
-
Input tokens/M
Output tokens/M
32
Context Length
Alibaba
Google
$8.75
$70
1k
$0.5
Openai
$14
$56
200
$0.7
$2.8
Tencent
Xai
128
$1.05
$4.2
01-ai
4
8
SadraCoding
SDXL-Deepfake-Detector 是一款精准检测 AI 生成人脸的工具,专注于维护数字世界的真实性,为抵御视觉虚假信息提供隐私保护且开源的解决方案。该模型通过微调预训练模型实现轻量级且高准确率的检测。
prithivMLmods
GA Guard系列是开源权重的审核模型,旨在帮助开发者和组织维护语言模型的安全性、合规性以及与现实世界的一致性。该模型可检测七种违规类别,包括非法活动、仇恨与辱骂、个人身份信息与知识产权、提示安全、色情内容、虚假信息以及暴力与自残。
Sami92
这是一个基于XLM-R Large微调的文本分类模型,专门用于识别德语虚假信息叙事。模型经过训练,能够检测常见的虚假信息模式,如移民犯罪、气候变化否认、选举操纵等叙事,为自动事实核查提供支持。
PirateXX
这是一个运用先进模型来检测文本内容是否由AI生成的工具。它能区分真实内容(Label_1)和AI生成的虚假内容(Label_0),旨在帮助用户识别信息的来源和可信度。
一个用于分析言论、验证来源和检测操纵的模型上下文协议服务器,采用多认知框架进行反虚假信息处理。
一个用于分析言论、验证来源和检测操纵的多框架反虚假信息服务器