最近、Deepdubは最新の音声AIモデル「Lightning2.5」を発表しました。このモデルは、同社がこれまでに開発した中で最も高速で拡張性の高い音声ソリューションであり、リアルタイムでのプロダクションレベルの音声体験を設計するためのものです。Lightning2.5は、多言語AIエージェント、コールセンター自動化、リアルタイムのコンテンツローカライズ、パーソナライズされたメディアやゲームなどのアプリケーションにおいて優れたサポート能力を示しています。
Lightning2.5は、Deepdubが独自に開発した言語および音声のベースモデルに基づいて開発され、人間レベルの表現力と高精度な音質を備え、複数の言語をサポートしています。このモデルはインフラストラクチャを拡張してリアルタイム性能を向上させ、話者の識別、トーン、感情の繊細さを保持し、ユーザーに現実的なプロダクションレベルの音声体験を提供します。
DeepdubのCEO兼共同創設者であるOfir Krakowski氏は、「Lightningは、リアルタイムで表現豊かな音声生成技術における重要な進歩です。多言語AIエージェントの駆動、没入型コンテンツプラットフォーム、または大規模な音声優先の自動化を問わず、Lightningは顧客が必要とする速度、保真度、品質で基本的な音声AIをプロダクション応用に届けます」と述べました。
この新しいモデルには、再設計された推論エンジンが搭載されており、処理量は2.8倍、同時処理能力は5倍となり、遅延は200ミリ秒にまで低下し、業界標準より0.5秒速くなっています。これにより、Lightningはリアルタイム音声インタラクション、ダイナミックな音声解説、イベント駆動型のAIプロセスなどに適しており、特に自律的な音声エージェント、インタラクティブシステム、大規模な音声自動化などの業界に適しています。
NVIDIAスタートアップ育成プログラムの一員として、DeepdubはH100、A100、L40S、A10GなどのNVIDIA GPUを対象にLightningを最適化し、ローカルおよびクラウド環境での展開をサポートしています。NVIDIA TensorRT-LLMアクセラレーションスタックを活用することで、企業規模の運用において高スループットかつ低遅延の推論を実現しながら、効率的な運用コストを維持しています。
NVIDIAメディア・エンターテイメント事業部副社長のRichard Kerris氏は、「組織がリアルタイム音声AIのニーズを求めているのは、正確な品質、速度、拡張性を組み合わせたものが増えています。DeepdubはNVIDIA GPUとTensorRT-LLMを基盤としてLightning2.5を開発し、多言語音声体験を超低遅延かつ高同時接続能力を持つようにし、顧客が世界中で次世代のAIエージェント、没入型コンテンツ、企業向け音声アプリケーションを提供できるように支援しています」と述べました。
Deepdubは2025年の国際放送会議(IBC)でLightningを紹介し、リアルタイム音声ローカライズ、ダイナミックコンテンツ自動化、拡張可能な音声パイプラインのライブデモを行う予定です。興味のある方はAI展示エリア、Hall14、Booth14.B53にお越しください。
ポイント:
🎤 Lightning2.5は、Deepdubが最新にリリースしたリアルタイム音声AIモデルで、処理量は2.8倍、同時処理能力は5倍となっています。
🌍 新モデルは多言語アプリケーションをサポートし、AIエージェント、コールセンター自動化などのシーンに適しています。
⚡ DeepdubはIBC2025でLightningのライブデモを行い、その強力な機能を紹介します。