『ニューヨーク・タイムズ』がオープンAIを相手に提起した長期にわたる著作権侵害訴訟において、重要な進展がありました。Ars Technicaの報道によると、この事件を審理している連邦裁判官は、『ニューヨーク・タイムズ』および共同原告である『ニューヨーク・デイリーニュース』と『インベスティゲーティブ・ジャーナリズム・センター』に対して、オープンAIのユーザー記録(削除済みの内容を含む)へのアクセスを許可しました。これは、著作権侵害の範囲を正確に特定するためです。
『ニューヨーク・タイムズ』は、チャットGPTのユーザーが有料壁を回避した後で履歴を削除する可能性があるため、大規模なデータ収集が必要だと考えています。同紙はさらに、これらのログの検索結果が今回の訴訟における鍵となる証拠になるかもしれないと主張しています。オープンAIの大規模言語モデル(LLM)は、著作権保護された資料を使用してトレーニングされており、それらのコンテンツを直接盗用した可能性もあるのです。この命令は先月発布され、オープンAIが控訴した後、今週確認されました。
オープンAIはこれに対し強い不満を示しています。先月、同社はこの命令により「長年にわたるプライバシー規範」を回避しなければならないと述べました。最新の裁定が発表された後、オープンAIのスポークスパーソンはArsに、「引き続き戦い続ける」と語りました。
注目すべきは、この裁定が『ニューヨーク・タイムズ』などの出版業者とオープンAIがデータベース検索の処理方法について交渉している時期に下されたことです。オープンAIは先月の声明で、この命令が無料のチャットGPTログから、APIを使用するユーザーのよりセンシティブな情報に至るまでカバーすると述べました。(この命令では特に、大学向けにカスタマイズされたチャットGPT EnterpriseやチャットGPT Eduのログは制限されないことが明記されています。)
著作権侵害の証拠を探すだけでなく、オープンAIのログ戦略は、チャットボット内で記事を要約することでニュース市場を希薄化させていることを証明するにも役立つかもしれません。その結果、リンクが潜在的な読者によって完全に回避されることで、メディア機関の広告収入が減少することになります。フォーブスの報道によると、今年の早い段階で、コンテンツライセンスプラットフォームのTollBitは、オープンAIやグーグルなどのチャットボットが出版者に送るトラフィックが従来の検索エンジンよりも96%少ないと発見しました。この傾向はすでにニュース業界に悪影響を与え始めています。