ハーバード大学、OpenAIとマイクロソフトの資金提供による大規模無料AIトレーニングデータセットを公開
ハーバード大学は木曜日、約100万冊のパブリックドメイン書籍を含む高品質なデータセットを公開すると発表しました。これは、誰でも大規模言語モデルやその他のAIツールをトレーニングするために利用できます。このデータセットは、ハーバード大学が新設した機関データイニシアチブ(Institutional Data Initiative)によって作成され、マイクロソフトとOpenAIの資金提供を受けています。収録されている書籍はすべて、Google ブックスプロジェクトでスキャンされた、著作権の保護期限が切れた作品です。