グーグルは最近、ウェブ上で行動を起こすことができる最初の人工知能エージェント「Project Mariner」を発表しました。Geminiを基盤とするこのエージェントは、Chromeブラウザを制御し、モバイル画面上のカーソルを操作し、ボタンをクリックし、フォームに入力することで、人間のようにウェブサイトを使用・閲覧できます。
Project Marinerは、「このリストに基づいて食料品店からカートを作成する」といった操作を実行できます。エージェントは食料品店のウェブサイトにアクセスし、商品を検索して仮想カートに追加します。ただし、クレジットカード番号や請求情報を入力すべきではないため、決済はできません。
グーグルの目標は、ユーザーがウェブサイトと直接やり取りするのではなく、ユーザーに代わって作業を行う生成AIシステムとやり取りできるようにすることです。これにより、TechCrunchのようなパブリッシャーからウォルマートのような小売業者まで、数百万もの企業に影響を与える可能性があります。これらはこれまで、グーグルが実際のユーザーをウェブサイトに誘導し、利用させることに依存してきたからです。
グーグルは水曜日、より具体的なタスク向けの人工知能エージェントをいくつか発表しました。これらには以下が含まれます:* Deep Research:複雑なテーマを探求するのに役立つAIエージェント。Jules:開発者がコーディングタスクを完了するのに役立つAIエージェント。ビデオゲームを閲覧するAIエージェント:ユーザーがビデオゲームの世界を閲覧するのに役立つAIエージェント。
Project Marinerがいつグーグルの大部分のユーザーに公開されるかはまだ不明ですが、公開されれば、これらのエージェントはより広範なウェブに大きな影響を与えるでしょう。ウェブは人間のために設計されていますが、グーグルのAIエージェントは、この基準を変える可能性があります。