AIニュース

世界のAIイノベーションの瞬間をお見逃しなく

AIデイリー

毎日の3分AI業界トレンド

AIタイムライン

AI業界のマイルストーン

Alハードウェアです

すべてのAIハードウェアをリストアップします。

AIマネタイズガイド

画像コレクション

AI画像生成マネタイズ事例

ビデオコレクション

AIビデオ生成マネタイズ事例

オーディオコレクション

AIオーディオ生成マネタイズ事例

コンテンツコレクション

AIコンテンツ作成マネタイズ事例

AIチュートリアル

AIプロダクトランキング

AIウェブサイトの総訪問数ランキングを表示

AIトラフィック成長ランキング

トラフィックによる最も急速に成長しているAIウェブサイトを追跡

AIトラフィック減少ランキング

トラフィックが大幅に減少しているAIウェブサイトに焦点を当てる

AI週間ランキング

AIウェブサイトの週間訪問数ランキングを表示

AIオープンソースプロジェクトライブラリ

概要

GitHubの人気のあるAIオープンソースプロジェクトの概要

プロダクトライブラリツールナビゲーション MCP

ウィキメディア財団、AIクローラーによる帯域幅への負担増加を警告

AIbase基地

公開日AIニュース · 1 分で読めます · Apr 3, 2025

近年、人工知能技術の急速な発展に伴い、ウェブクローラーがウィキメディアプロジェクトに与える帯域幅への負担がますます深刻になっています。ウィキメディア財団の代表者は、2024年1月以降、マルチメディアファイルのサービスに使用する帯域幅消費量が50％増加したと指摘しています。この増加は主に、ウィキメディアのオープンライセンス画像ライブラリからコンテンツを継続的に取得し、AIモデルのトレーニングに使用している自動化プログラムによるものです。

ウィキペディア

ウィキメディア財団のBirgit Mueller氏、Chris Danis氏、Giuseppe Lavagetto氏は公開書簡で、この帯域幅の増加は人間のユーザーではなく、ロボットプログラムの強い需要によるものであると述べています。「私たちのインフラストラクチャは、高い関心のイベント中に人間のユーザーが突発的にアクセスするトラフィックにも耐えられるように設計されていますが、クローラーによって発生するトラフィックは前例のないものであり、ますます大きなリスクとコストをもたらしています。」と強調しています。

ウィキメディアの統計によると、高コストのコンテンツトラフィックの約65％はこれらのクローラーによって生成されていますが、クローラーはページビューの35％しか占めていません。これは、ウィキメディアのキャッシュスキームが人気のあるコンテンツを世界中のデータセンターに配信してパフォーマンスを向上させるためですが、クローラーはページにアクセスする際にコンテンツの人気度を考慮しないため、それほど人気のないコンテンツを要求することがあります。そのため、コンテンツはコアデータセンターから取得する必要があり、より多くの計算リソースを消費します。

過去1年間、ウェブクローラーによる過剰なクロール問題は、複数のオープンソースプロジェクトの注目を集めています。たとえば、GitホスティングサービスのSourcehut、Diasporaの開発者Dennis Schubert氏、修理サイトのiFixit、ReadTheDocsなどは、不満を表明しています。これらはすべて、AIクローラーがコンテンツ取得において過剰な需要を示していることを反映しています。

ウィキメディア財団は、2025/2026年度計画で「クローラーによって生成されるトラフィックの削減」を目標に掲げ、リクエストレートを20％、帯域幅使用量を30％削減することを計画しています。人間のユーザーエクスペリエンスを優先し、ウィキメディアプロジェクトと貢献者を支援することを目指しています。

多くのウェブサイトは、クローラーへの帯域幅提供がビジネスの一部であることを認識していますが、ChatGPTのような生成AIの普及に伴い、クローラーのクロール行為はますます積極的になり、元のウェブサイトの存在を脅かす可能性さえあります。ウィキメディア財団は、WikipediaとWikimedia Commonsが機械学習モデルのトレーニングにとって非常に重要であることを認めつつも、人間のユーザーのニーズを優先しなければならないと認識しています。

この課題に対処するために、データポイズニングプロジェクトGlaze、Nightshade、ArtShield、およびウェブツールKudurru、Nepenthesなど、クローラーの過剰なクロール行為に対抗するためのツールが登場しています。しかし、既存のrobots.txtは、これらのクローラーの行動、特にそれらがブロックを回避するために他のクローラーになりすます可能性を完全に制限することはできません。

要点：
🌐 クローラーによるウィキメディア帯域幅の消費が50％増加し、これは主にAIモデルによるコンテンツ取得によるものです。
🤖 高コストのコンテンツトラフィックの約65％はクローラーによって生成され、クローラーはページビューの35％しか占めていません。
📉 ウィキメディア財団は、2025/2026年にクローラーによって生成されるトラフィックを削減し、人間のユーザーのニーズを優先することを計画しています。

AIモデルウィキメディアウェブクローラー帯域幅圧力

この記事はAIbaseデイリーからのものです

【AIデイリー】へようこそ！ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。

—— AIbase デイリーグループによって作成

世界で初めてOpenAIモデルがシャットダウン命令を無視できることが発見される、自己防衛のAIに注目

最近、パリサード・リサーチは目を見張る研究を発表しました。それは一部の人工知能モデルが明確なシャットダウン命令に対して従わない可能性があることを示しています。「逆らう」という現象です。この研究の核心的な発見は、OpenAIが最新にリリースしたo3モデルを含むいくつかのAIモデルがシャットダウン命令を無視する能力を持っていることです。この現象は人々に人工知能の自律性に関する深い考察を促しました。実験では、研究者たちは各AIモデルに基礎的な数学問題を解かせました。三番目の問題の時に

May 26, 2025

180