超高速テキスト音声変換モデルLightning:超低遅延、100ミリ秒で10秒の音声生成
最近、カリフォルニア州サンフランシスコに拠点を置くAIスタートアップ企業smallest.aiは、100ミリ秒で最大10秒の音声生成が可能な新しいテキスト音声変換(TTS)モデル、Lightningを発表しました。この技術の進歩により、世界中の開発者は、高忠実度の音声ボットアプリケーションを構築することができ、遅延時間が大幅に短縮され、実装コストが削減され、アプリケーションのアクセシビリティが向上します。Lightningは現在、英語とヒンディー語の複数のアクセントをサポートしており、チームはさらに迅速に言語を追加する計画です。