Blueskyユーザーデータがスクレイピング:100万件以上の公開投稿がAIトレーニングに使用される
最近、ソーシャルメディアプラットフォームBlueskyで大規模なデータスクレイピング事件が発生しました。機械学習図書館員のダニエル・ファンストリン(Daniel van Strien)氏がBlueskyのAPIインターフェースから100万件以上の公開ユーザー投稿をスクレイピングし、AI企業Hugging Faceにアップロードしました。このデータセットには、ユーザーの分散型識別子(DID)と、特定のユーザーコンテンツを検索できる機能が含まれていました。ファンストリン氏は...