最近、グーグルはAIアシスタント「Gemini Live」のインタラクティブな体験を強化するための新しい機能を発表しました。これらの新機能により、ユーザーはアシスタントとより自然で直感的なリアルタイムの会話を楽しめるようになります。日常生活での利便性が向上します。

image.png

まず、Gemini Liveにはスクリーンハイライト機能が実装されます。これは、ユーザーがスマートフォンのカメラで周囲の物をスキャンし、AIアシスタントがスクリーン上に関連するオブジェクトをハイライト表示することを意味します。これにより、必要なツールを素早く見つけることができます。例えば、あるプロジェクトに適したツールを探している場合、スマートフォンを工具の山に向けるだけで、Gemini Liveが正しい選択肢を直接指し示します。この機能は、8月28日に新発売のPixel 10端末とともにリリースされ、同じタイミングで他のAndroidデバイスにも配信される予定です。その後、iOSプラットフォームにも段階的に拡張されていきます。

image.png

次に、グーグルは新しいアプリケーション統合機能をリリースする予定です。これにより、Gemini Liveはさらに多くのアプリケーションと対話できるようになります。メール、電話、時計なども含まれます。ユーザーがGeminiと方向について話し合いながら、自分が遅刻しそうだと気づいた場合、いつでも会話を中断できます。たとえば、「このルートは良いですね。アレックスに私の10分遅れることをメッセージしてください」と言えば、Geminiは自動的にメッセージの下書きを作成し、コミュニケーション効率を高めます。

最後に、グーグルはGemini Liveの音声モデルを更新し、会話中の音声表現を「大幅に改善」すると述べています。語調、リズム、音高などの重要な要素が向上します。今後、Geminiはユーザーの質問内容に応じてトーンを調整し、緊張する話題ではより冷静な声を使用します。また、ユーザーはGeminiの語速を調整でき、既存のChatGPTの音声モードに似たものになります。さらに、特定の役割や歴史的人物の視点から物語を生き生きと語ってほしいと依頼した場合、アシスタントはそれに応じた訛りを使用して、物語がより生き生きとして面白くなります。

これらの新機能の登場は、グーグルが人工知能アシスタントの実用性と人間らしい特徴を向上させるために重要な一歩を踏み出したことを示しています。

ポイント:

🌟 Gemini Liveにはスクリーンハイライト機能が登場し、必要な物品を素早く見つけることができます。

📱 新しいアプリケーション統合機能により、メールや電話などのアプリとのやりとりが効率的になります。

🎤 更新された音声モデルにより、アシスタントの音声表現がより自然になり、語速やトーンの調整が可能です。