Nature惊人内幕:无数论文被偷偷高价出售喂AI 作者毫不知情
学术界近期面临了一场关于数据使用权的争议,随着许多学术出版商开始将研究论文数据打包出售给科技公司用于训练AI模型,这一行动引发了广泛讨论。泰勒与弗朗西斯出版商与微软、威利出版商与某家公司之间的交易,使得学术成果被用于提升AI系统能力,这一做法在科研界引起了波澜。专家指出,一旦论文被用于训练,很难在后续移除,且数据集的广泛获取使得AI模型能够学习并生成高质量文本。华盛顿大学研究员Lucy Lu Wang表示,学术论文作为信息密度高、篇幅长的数据源,对大型语言模型训练极为宝贵。购买高质量数据集的趋势上升,使得媒体、平台与AI开发者合作,销售内容成为可能。然而,对于如何证明论文是否在训练集中,以及如何分配信用和使用权限,目前缺乏明确机制。这引发了对AI使用版权内容的法律与伦理争议,部分学者对此表示欢迎,认为AI能提升研究准确性,但也有人对此表示担忧,认为自身工作受到威胁。未来,如何平衡AI发展与学术诚信,将是科研领域面临的重要挑战。