Nature驚人內幕:無數論文被偷偷高價出售喂AI 作者毫不知情
學術界近期面臨了一場關於數據使用權的爭議,隨着許多學術出版商開始將研究論文數據打包出售給科技公司用於訓練AI模型,這一行動引發了廣泛討論。泰勒與弗朗西斯出版商與微軟、威利出版商與某家公司之間的交易,使得學術成果被用於提升AI系統能力,這一做法在科研界引起了波瀾。專家指出,一旦論文被用於訓練,很難在後續移除,且數據集的廣泛獲取使得AI模型能夠學習並生成高質量文本。華盛頓大學研究員Lucy Lu Wang表示,學術論文作爲信息密度高、篇幅長的數據源,對大型語言模型訓練極爲寶貴。購買高質量數據集的趨勢上升,使得媒體、平臺與AI開發者合作,銷售內容成爲可能。然而,對於如何證明論文是否在訓練集中,以及如何分配信用和使用權限,目前缺乏明確機制。這引發了對AI使用版權內容的法律與倫理爭議,部分學者對此表示歡迎,認爲AI能提升研究準確性,但也有人對此表示擔憂,認爲自身工作受到威脅。未來,如何平衡AI發展與學術誠信,將是科研領域面臨的重要挑戰。