最高のटेक्स्ट टू स्पीच (TTS) AIツールモデル_厳選टेक्स्ट टू स्पीच (TTS)情報

AIニュース

Gemini TTS 2.5が正式リリース：Googleが感情表現対応の音声を提供 24言語+マルチキャラクター一括切り替え

GoogleがGemini 2.5 FlashとProテキスト読み上げモデルを発表。24言語対応で感情表現やリズム調整が可能。AI Studioで無料テスト提供中。....

マイクロソフトがリアルタイム音声モデルVibeVoice-Realtime-0.5Bをオープンソース化 300ミリ秒でリアルタイム発声 90分の長音声も問題なし！

マイクロソフトがリアルタイム音声モデルVibeVoice-Realtime-0.5Bをオープンソース化しました。非常に低遅延で、実に人間のような音声表現を備えています。テキスト入力から音声出力にかかる平均時間は300ミリ秒で、従来のTTSモデルよりも1〜3秒と比べて大幅に短く、ほぼゼロ遅延のリアルタイム音声合成を実現しています。

23.5k 14 時間前

B站オープンソースのテキストから音声への変換モデルIndexTTS-2.0　感情と長さを制御可能

B站Indexチームがテキスト読み上げシステム「IndexTTS-2.0」をオープンソース化。感情制御と時間調整が可能で、ゼロショットTTS技術のブレークスルーを実現。....

11.2k 3 時間前

B站オープンソースのテキストから音声への変換モデルIndexTTS-2.0　感情と長さを制御可能

マイクロソフトがVibeVoice TTSモデルをオープンソース化: 90分の超長時間音声可変人数の会話中文の効果は驚き！

マイクロソフトがオープンソースのテキスト音声変換モデル「VibeVoice」を公開。90分の長音声生成をサポートし、長文音声、複数人対話、中国語合成に新たな基準を設定。....

10.7k おととい

AI製品

Qwen3-TTS-Demo

先進的なテキストから音声へのモデルで、高品質な音声合成サービスを提供します。

テキストを音声に変換

6.6k

Hathora

音声AIのASR、TTS、LLMモデルを提供し、リアルタイムアプリケーション向けにテスト?デプロイ可能です。

開発プラットフォーム

6.5k

Nepvox AI

ネパール初のAIコンテンツ作成プラットフォームで、TTS、STT、テキストから画像への変換をサポートし、500種類以上の音声、100種類以上の言語に対応しています。

コピーライティング生成器

SAM TTS

無料でオンラインで、クラシックなMicrosoft SAMのテキスト読み上げサービスを利用できます。

テキストを音声に変換

7.6k

モデル

qwen3-tts-flash

Alibaba

入力トークン/百万

出力トークン/百万

コンテキスト長

qwen3-tts-flash-realtime

Alibaba

入力トークン/百万

出力トークン/百万

コンテキスト長

qwen-tts-realtime

Alibaba

$2.4

入力トークン/百万

$12

出力トークン/百万

コンテキスト長

qwen-tts

Alibaba

$1.6

入力トークン/百万

$10

出力トークン/百万

コンテキスト長

MCP

Zonos TTS

Zonos TTSとClaudeのMCP統合プロジェクトで、テキストを音声に変換する機能を実現します。

typescript

7.7k

2.5ポイント

Fish Speech Mcp

FishSpeechに基づくテキスト読み上げ（TTS）MCPサーバーで、音声参照の保存をサポートし、DiveなどのMCP互換のLLMと統合して使用できます。

typescript

8.6k

2.5ポイント

Kokoro TTS

Kokoro TTSエンジンをベースにした音声合成MCPサービス

python

8.4k

2.5ポイント

Chatterbox Mcp

Chatterbox TTSモデルに基づく簡易MCPサーバーで、テキストを音声に変換して自動再生する機能を提供し、リアルタイムの進捗通知と自動モデルロードをサポートしています。

python

6.4k

2.5ポイント

Kokoro Tts Mcp

Kokoroテキスト読み上げ（TTS）MCPサーバーで、MP3ファイルの生成とS3ストレージへのアップロードをサポートしています。

python

7.8k

2.5ポイント

DeepCo

Deep - CoはCompose Multiplatformをベースに開発されたクロスプラットフォームチャットクライアントで、OpenRouter、Anthropic、Grok、OpenAIなどの複数のLLM APIプロバイダをサポートし、OpenAI APIとローカルモデルと互換性があります。チャット履歴管理、プロンプト管理、ロール適合、TTSなどの機能を備え、多言語とテーマカスタマイズをサポートしています。

kotlin

11k

2.5ポイント