2025年のGoogle I/O開発者カンファレンスで、グーグルはAIとXR技術の最新の成果を展示しました。これは創作ツール、開発者プラットフォーム、ユーザーエクスペリエンスという3つの主要な分野にわたっています。新世代のビデオジェネレーターVeo3、イメージジェネレーターImagen4、新しいXRプラットフォームAndroid XR、そして最上級のAIサブスクリプションサービス「AI Ultra」が発表の中心となりました。
AIクリエイティブツールの重要なアップデートとして、Veo3はナティブなオーディオトラック付きのビデオを生成することができます。現在は、アメリカのUltraサブスクライバーやVertex AIの企業クライアント向けに公開されています。一方、Imagen4はより優れたレイアウトと画像の詳細性を提供し、マルチフォーマット出力にも対応しています。両方ともGeminiアプリ、Workspace、Whisk、そして新しいAI映画制作プラットフォームFlowに統合されています。
Flowはシーン生成、レンズコントロール、素材管理などの機能を備えており、ユーザーがAIと独自コンテンツをミックスして完全な映画クオリティのコンテンツプロセスを作成することを可能にします。また、グーグルはミュージックジェネレーションモデルLyriaも公開しました。これにより、YouTube ShortsやVertex AIを通じてミュージッククリエイターにAIによるクリエイティブ能力を提供します。
ハイエンドなクリエイターや企業のニーズに対応するため、グーグルは月額249.99ドルのAI Ultraサブスクリプションを導入しました。このサブスクリプションには、Veo3、Imagen4、Project Marinerエージェントツール、YouTube Premium、30TBのクラウドストレージなどが含まれています。また、Pro版も選択肢として用意されています。
Gemini Liveは、Geminiアプリに登場し、カメラや画面共有を利用してリアルタイムで協力する機能を提供します。これは障害解析やイベント企画に役立ちます。さらに、Geminiの機能はChromeにも組み込まれており、ウェブコンテンツの分析と要約が可能です。
通信面では、Google Meetは英語とスペイン語で動作するAI翻訳機能を追加し、トーンや表情を模倣します。この機能は最初にProおよびUltraユーザー向けに提供されます。また、Gmailではユーザーの過去のメールデータに基づいたパーソナライズされたスマート返信機能が導入されますが、これを利用するにはユーザーの許可が必要です。
開発者向けには、Gemini APIに非同期関数、ネイティブオーディオ、ツールコンテキストプロトコル(MCP)などの高度な機能が追加されました。新モデルとして、軽量モバイルモデルであるGemma3n、医療用途向けのMedGemma、手話認識のSignGemmaが導入され、グーグルのAIモデルポートフォリオをさらに拡張しました。
AI生成されたコンテンツの信頼性を強化するために、グーグルはSynthID Detectorポータルを導入しました。これは透明なウォーターマークを使用して、画像、テキスト、オーディオ、ビデオがAIによって生成されたかどうかを識別します。すでにこのマークシステムは数十億ものプロジェクトで使用されています。
最後に、グーグルは新しいAR/MRプラットフォームAndroid XRを発表しました。これは将来のXRデバイス(ARグラスやヘッドマウントディスプレイ)にオペレーティングシステムを提供します。Geminiの知能と連携することで、リアルタイム翻訳、環境分析、メッセージ処理などの機能をサポートします。グーグルはGentle MonsterやWarby Parkerなどと協力しており、年内にSDKをリリース予定です。
今回の発表では、GoogleがAI能力を製品、コンテンツ作成、エンドユーザー向けプラットフォームに深く統合し、AIネイティブエコシステムの構築に向けて本格的に進出していることが示されました。