芝加哥大學研究發現,AI文本檢測器性能差異顯著,部分工具準確率高,但有的頻繁誤判,尤其在短文本中失靈。Pangram檢測器以高精度和成本效益表現最佳。研究基於1992篇人類文本和四款主流大模型,覆蓋六類文本類型,揭示檢測器在可靠性和魯棒性方面的不足。
芝加哥大學研究發現,市面AI文本檢測工具性能差異顯著。研究基於1992篇人類文本(含評論、新聞、小說等六類)及GPT-4等主流模型生成的AI文本進行測試,結果顯示不同檢測工具準確率存在明顯差距,呼籲提升檢測技術可靠性。
精準檢測ChatGPT等多模型AI生成內容,支持20+語言,準確率超99.98%