情報

AIニュース

AIの最先端を探索、業界トレンドを完全マスター

AIニュース日報

毎日更新！AIホットトピックス＆業界最前線

情報

AIツールを探す

精確な製品選定＆多角的市場調査

AI製品ランキング

話題のAI製品総合力＆バズ度ランキング（年間/月間/デイリー）

AIプロダクト登録

AI製品を登録して、認知度アップ＆ユーザー獲得を加速！

ツール

AIツールディレクトリ

AIツール総合ナビ！あなたにピッタリのツールが見つかる

情報

AIモデルファインダー

全種類AIモデル完備！開発から研究まで、あなたのニーズを完全サポート

LLMランキング

人気AI大規模モデル性能・注目度・年/月/日ランキング

LLMプロバイダー

信頼できるAIモデルパートナーを見つけよう！安心のサポート体制

AIモデル登録

AIモデル・サービスを登録して、ターゲットユーザーに確実にリーチ！

ツール

LLM比較選定

AI大規模モデル徹底比較！あなたにピッタリのモデルが見つかる

LLMコスト計算機

AIモデルのコストを正確に把握！スマートな予算計画で無駄を削減

LLMアリーナ

マルチモデルリアルタイム評価、モデル出力結果迅速比較

情報

MCPサーバー

人気AI-MCPサービスを集約、あなたに適したサービスを迅速発見

MCPクライアント

MCPクライアントに簡単接続、強力なAI機能を呼び出し

MCPケースチュートリアル

MCP使用テクニックを学習、入門から上級まで

MCPランキング

人気MCPサービス性能ランキング、最適選択をサポート

MCPサービス提出

あなたのMCPサービスを公開・プロモーション

ツール

MCP実験場

MCPサービスを自由にテスト、オンラインで迅速体験

MCPインスペクター

MCPサービス迅速テスト、迅速リリース

AIブランドモニタリング

AIモデルによるブランド引用の分析と追跡

GEO順位最適化サービス

GEOサービスにより、御社の企業やブランドのAI検索における支配的な表示を実現

GEOランキング照会ツール

AIプラットフォーム上のブランド認知度を測定する

ツール

AIモデル互換性チェッカー

PC環境でDeepSeek・Llamaが動作するか無料診断

モデル展開サーバー構成計算機

大規模モデルの計算力要件を入力すると、最適なGPU・メモリ・サーバー構成を即座に推薦

AIチュートリアル

情報

AIデータセット

モデルの訓練・評価・テスト用大規模データセット・ベンチマーク

ツール

インテリジェント文書認識

ユーザーに各種文書のテキスト抽出・文書処理を提供、汎用・カスタムシーン対応の多様な文書処理をサポート

Gemini2.5バージョンのリリース：ネイティブオーディオ機能により、AIによる対話がさらに自然に

AIbase基地

公開日AIニュース · 1 分で読めます · Jun 5, 2025

最近の開発アップデートにおいて、グーグルはGemini2.5バージョンをリリースし、AIによる音声対話と生成技術に大きな進展がもたらされました。Gemini2.5はマルチモーダルなAIシステムであり、テキスト、画像、音声、ビデオ、コードなどを原生で理解し生成できるため、ユーザーとAIとのインタラクション体験を向上させています。

Gemini2.5のリアルタイム音声対話機能により、ヒューマンとマシンのコミュニケーションがより自然になりました。人間の会話にはトーン、訛り、笑いなどの非言語的な音声要素が含まれることが多いため、これらのディテールはGeminiの音声生成技術によって忠実に再現されます。その低遅延特性により、スムーズで自然な会話が可能になり、ユーザーは自然な言葉を使って会話のスタイルを調整できます。例えば、異なる訛りやトーン、さらにはささやき声でのコミュニケーションも選択可能です。

リアルタイム音声対話

人間の会話は豊かで繊細なものであり、意味は話された言葉だけでなく、トーン、訛り、笑いなどの非言語的な音声要素にも依存しています。Gemini2.5は音声を通じて効率的かつリアルタイムのコミュニケーションを目指しており、その音声対話機能には以下の特長があります:

自然な対話:高品質な音声インタラクションを提供し、適切な表現力とリズムを持つため、会話がスムーズで自然に進行します。遅延も極めて低いです。
スタイル制御:ユーザーは自然言語による指示で、対話のトーン、訛り、感情表現をカスタマイズすることが可能です。ささやき声での会話も選択できます。
ツール統合:対話中、Gemini2.5はGoogle検索などからの情報をリアルタイムで取得し、対話を実用的に強化します。
対話のコンテキスト認識:システムはバックグラウンドノイズや無関係な会話を識別・無視し、適切なタイミングで応答します。
音声・映像理解:リアルタイムの音声および映像ストリームをサポートし、ユーザーとビデオ内容や画面共有情報について議論できます。
マルチリンガル対応:24以上の言語をサポートし、同じ会話内で複数の言語を柔軟に切り替えられます。
感情対話:ユーザーのトーンに基づいて反応し、異なる表現方法における感情の違いを理解します。
高度な思考対話:推論能力により、対話の一貫性と知能性を向上させ、特に複雑な問題において優れたパフォーマンスを発揮します。

コントロール可能なテキストから音声への変換技術

Gemini2.5のテキストから音声への変換（TTS）技術は新たなブレークスルーを迎えました。ユーザーは自然な音声出力を生成するだけでなく、音声にこれまでにないコントロールを行うことができます。ユーザーは短いフレーズから長編の説明まで生成でき、スタイル、トーン、感情、表現を正確に制御し、すべての要素は自然言語の指示で調整可能です。

ダイナミックな表現:テキストを魅力的に朗読し、詩、ニュースリポート、物語の読み聞かせに最適です。特定の感情や訛りを表現することも可能です。
速度と発音のコントロール:ユーザーは音声のスピードを調整でき、特定の単語の正確な発音を確保できます。
複数の話者対話生成:テキスト入力に基づいて二人の話者による音声対話を生成できるため、コンテンツがより魅力的になります。
多言語音声生成:簡単に多言語の音声コンテンツを生成でき、24以上の言語に対応しています。

Gemini2.5の開発中、グーグルは潜在的なリスクを慎重に評価し、適切な緩和策を講じました。すべての音声出力には「SynthID」というウォーターマーク技術が埋め込まれており、AI生成音声の透明性と識別可能性を確保しています。

Gemini2.5は開発者にとって多くのネイティブな音声機能を提供し、Google AI StudioやVertex AIのGemini APIを利用して、よりインタラクティブなアプリケーションを作成することができます。開発者はGoogle AI StudioのストリームタブでGemini2.5 Flashプレビューのネイティブ音声対話を試すことができます。また、コントロール可能なテキストから音声への変換を使用して、お知らせ、物語、ポッドキャスト、ビデオゲームなどのアプリケーションにおける音声の革新を促進できます。

Gemini2.5 AIオーディオ対話 Google マルチモーダルAIシステム

この記事はAIbaseデイリーからのものです

【AIデイリー】へようこそ！ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。

—— AIbase デイリーグループによって作成

テスラとボルボの人工知能アシスタントが承認され、上海がスマートサービスの新しい時代を切り開く！

テスラとボルボのAIサービスが上海で初の外資系大規模AI製品として承認。テスラは「xBotカスタマーサービス」でオーナー向けスマートQ&Aを提供、ボルボも「小沃スマートアシスタント」を推進し、上海自動車産業の革新力を示す。....

Nov 13, 2025

Verinext と DevRev がスマート AI アシスタントを共同でリリース企業のデータ統合と自動化を支援

Verinext と DevRev は AI アシスタント「Computer」を共同でリリースし、企業内のデータボトルネックを解消し、AIイノベーションを推進し、企業成長を支援することを目的としています。Verinext は安全で責任ある AI 解決策を提供することに注力しており、高い投資収益率とビジネス価値を確保します。ユースケース分析からカスタムアプリケーションやインフラ近代化まで、一貫して専門的な指導を提供し、既存の AI コンポーネントを統合しています。

Nov 13, 2025

李彦宏：AIの内包により生産性が再構築される

2025年百度ワールドで李彦宏氏が「効果の創発」と題し講演。AI能力の内面化により、知能はコストから生産性向上の要因へと変容。AI産業構造は「正ピラミッド」から「逆ピラミッド」へ転換し、モデルと応用の価値を大幅に向上させると指摘。....

Nov 13, 2025

AIエコシステム効果が加速して放出され、テンセントのQ3営業利益は前年同期比18％増の726億元に

テンセントの第3四半期売上収入は1928.7億元で、前年同期比15％増加。営業利益は725.7億元で、18％増加。主要事業とAIが協力し、各部門で二桁の成長を実現：サービス収入は958.6億元（16％増）、ゲーム業務は22.8％増加。マーケティングサービス収入は362.4億元（21％増）。AIとWeChatエコシステムにより恩恵を受けた。

Nov 13, 2025

リ・フェイフエWorld Labsが大作を発表！Marble 3D世界モデルのパブリックベータテスト文字列/画像が一瞬で操作可能なバーチャル宇宙に

李飛飛氏のWorld LabsがMarble3D世界モデルの公測を開始。テキストや画像などから完全な3D仮想世界を生成可能。リアルタイム編集と多形式出力に対応。実験段階から実用ツールへ移行。....

Nov 13, 2025

Reverieがインド専用の音声認識モデルをリリースし、Deepgramを上回る性能を実現

Reverie社は、ヒンディ語、英語およびHinglishの混合言語をサポートする新しい音声からテキストへの変換モデルを発表しました。このモデルは、インドの多言語環境に適応しており、300万回以上のAPI呼び出しを処理し、銀行やコールセンターなど業界での高い正確性と迅速な応答能力を示しています。

Nov 13, 2025

AIニュース：百度が文心5.0を発表；KeLing 2.5Turboモデルに最初と最後のフレーム機能が追加；微博がVibeThinker-1.5Bをリリース

【AIニュース】KeLing 2.5 Turboモデルをリリースし、新たに「最初と最後のフレーム」機能を追加し、AI動画生成の制御性、安定性、一貫性を著しく向上させ、プロのクリエイティブコンテンツ制作にさらに優れた解決策を提供します。

Nov 13, 2025

百度検索が正式にオリオンAIエンジンを発表

百度はAIエンジン「百度猎户座」を発表。25年の検索技術とAI能力を初めて全面開放し、企業・開発者向けにAPI・多模态プラットフォームを提供。AI技術応用の重要な進展を示す。....

Nov 13, 2025

LMArenaが最新のAI大規模モデルランキングを発表：Claude、GPT-5および智譜GLM-4.6が並んで第一位

LMArenaによる最新のAIプログラミングモデルランキングによると、AnthropicのClaude、OpenAIのGPT-5および智譜GLM-4.6が世界でトップに並んでいます。これらのプログラミングに特化したモデルは、コードの作成・デバッグ・最適化の効率を著しく向上させ、ソフトウェア開発を促進しています。

Nov 13, 2025

テスラxBot、ボルボのワオが国家登録を通過！上海が外資系大規模モデルの導入を率先して開放、AI監督が新たな段階へ

テスラxBotとボルボ「小沃」が、中国のAIサービス登録を初めて取得した外資製品となり、中国のAIガバナンス枠組みの成熟と、グローバルなコンプライアンスAIイノベーションへの開放姿勢を示しています。....

Nov 13, 2025

AIニュース

AIニュース日報

AIツールを探す

AI製品ランキング

AIプロダクト登録

AIツールディレクトリ

AIモデルファインダー

LLMランキング

LLMプロバイダー

AIモデル登録

LLM比較選定

LLMコスト計算機

LLMアリーナ

MCPサーバー

MCPクライアント

MCPケースチュートリアル

MCPランキング

MCPサービス提出

MCP実験場

MCPインスペクター

AIブランドモニタリング

GEO順位最適化サービス

GEOランキング照会ツール

AIモデル互換性チェッカー

モデル展開サーバー構成計算機

AIデータセット

インテリジェント文書認識

Gemini2.5バージョンのリリース：ネイティブオーディオ機能により、AIによる対話がさらに自然に

AIbase基地

リアルタイム音声対話

コントロール可能なテキストから音声への変換技術

この記事はAIbaseデイリーからのものです

関連AIニュースの推奨

テスラとボルボの人工知能アシスタントが承認され、上海がスマートサービスの新しい時代を切り開く！

​Verinext と DevRev がスマート AI アシスタントを共同でリリース 企業のデータ統合と自動化を支援

李彦宏：AIの内包により生産性が再構築される

AIエコシステム効果が加速して放出され、テンセントのQ3営業利益は前年同期比18％増の726億元に

リ・フェイフエWorld Labsが大作を発表！Marble 3D世界モデルのパブリックベータテスト 文字列/画像が一瞬で操作可能なバーチャル宇宙に

Reverieがインド専用の音声認識モデルをリリースし、Deepgramを上回る性能を実現

AIニュース：百度が文心5.0を発表；KeLing 2.5Turboモデルに最初と最後のフレーム機能が追加；微博がVibeThinker-1.5Bをリリース

百度検索が正式にオリオンAIエンジンを発表

LMArenaが最新のAI大規模モデルランキングを発表：Claude、GPT-5および智譜GLM-4.6が並んで第一位

テスラxBot、ボルボのワオが国家登録を通過！上海が外資系大規模モデルの導入を率先して開放、AI監督が新たな段階へ

Verinext と DevRev がスマート AI アシスタントを共同でリリース企業のデータ統合と自動化を支援

リ・フェイフエWorld Labsが大作を発表！Marble 3D世界モデルのパブリックベータテスト文字列/画像が一瞬で操作可能なバーチャル宇宙に