最高のTTS AIツールモデル_厳選TTS情報

AIニュース

27B数学理 SOTA と3秒間の感情クローン有道が子曰4マルチモーダルおよびTTSエンジンを全面的にオープンソース化

NetEase Youdaoが「子曰」大モデル4.0を発表し、全モーダル時代にアップグレード。テキスト、画像、音声の融合インタラクションをサポート。マルチモーダルモデルとTTSモデルをオープンソース化。翻訳モデルを再構築し、品質と効率を向上。視覚と数理分野でSOTAを達成し、テキスト数理問題で業界をリード。....

13.4k 3 時間前

27B数学理 SOTA と3秒間の感情クローン有道が子曰4マルチモーダルおよびTTSエンジンを全面的にオープンソース化

Inworld AI がリアルタイム TTS-2 をリリース：ユーザーの会話スタイルに適応するクローズドループ音声モデル

Inworld AI は、API プレビュー版を通じて実現されたリアルタイム TTS-2 音声モデルを発表しました。従来のテキストから音声への変換とは異なり、このモデルはユーザーのトーン、リズム、感情をリアルタイムで感知でき、文字起こしに依存せず、より自然でスムーズな会話体験を提供するクローズドループシステムアーキテクチャを採用しています。

15.9k 3 時間前

Inworld AI がリアルタイム TTS-2 をリリース：ユーザーの会話スタイルに適応するクローズドループ音声モデル

小米が全ラウンド音声大モデル MiMo-V2.5 を発表。TTSで1つの文で新しいボイドを生成可能。ASRは方言と多言語の混在に対応し、オープンソースをサポート

小米がMiMo-V2.5全リンク音声モデルシリーズを発表。TTSモデル3種とオープンソースASRモデル1種を含み、音声入力と出力をカバー。TTSモデルは感情、トーン、役割を正確に制御し、音声のプログラミング、創作、複製を可能にし、人機対話の自然さを向上させ、音声インテリジェンスの新時代を切り開く。....

22.1k 7 時間前

小米 MiMo-V2.5の衝撃的なベータテスト：4.3時間で手作業でコンパイラを作成、長距離スマートエージェントが満点の飛躍を遂げる

小米はMiMo-V2.5シリーズの大モデルを発表し、MiMo-V2.5、V2.5-Proおよび対応するTTSとASRモデルを含んでおり、モデルが「使える」から「使いやすい」へと進化したことを示している。その中でもエース型のMiMo-V2.5-Proは、一般的なスマートエージェント機能とソフトウェアエンジニアリングにおいて、Claude Opus4.6やGPT-5.4などのトップモデルと競合できる水準に達しており、主な強みは高い指示従従性と自己修正能力である。

16.5k 6 時間前

小米 MiMo-V2.5の衝撃的なベータテスト：4.3時間で手作業でコンパイラを作成、長距離スマートエージェントが満点の飛躍を遂げる

AI製品

Seed Audio

Seed Audio AIにはTTS、ASRなどが含まれ、APIを通じてクリエイターや開発者に音声を生成します。

音声生成

5.2k

Miso One

Miso OneはMiso Labsが開発した英語のTTSモデルで、感情豊かな音声生成をサポートしています。

テキストを音声に変換

6.8k

KugelAudio

ヨーロッパ初の量産可能なTTS。40種類以上の言語の自然な音声、ヨーロッパで開発・管理、GDPR準拠

テキストを音声に変換

オムニボイス

高品質な音声クローン TTS モデルで、600種類以上の言語をサポートしています。

テキストを音声に変換

6.2k

モデル

qwen3-tts-flash

Alibaba

入力トークン/百万

出力トークン/百万

コンテキスト長

qwen3-tts-flash-realtime

Alibaba

入力トークン/百万

出力トークン/百万

コンテキスト長

qwen-tts-realtime

Alibaba

$2.4

入力トークン/百万

$12

出力トークン/百万

コンテキスト長

qwen-tts

Alibaba

$1.6

入力トークン/百万

$10

出力トークン/百万

コンテキスト長

MCP

Zonos TTS

Zonos TTSとClaudeのMCP統合プロジェクトで、テキストを音声に変換する機能を実現します。

typescript

8.7k

2.5ポイント

Claude Code Tts

Claude Code 用に設計されたテキスト読み上げ MCP サーバープラグインです。OpenAI TTS API を使用してテキストを音声に変換し、自動音声フィードバック機能を提供します。

10.7k

2.5ポイント

Fish Speech Mcp

FishSpeechに基づくテキスト読み上げ（TTS）MCPサーバーで、音声参照の保存をサポートし、DiveなどのMCP互換のLLMと統合して使用できます。

typescript

9.8k

2.5ポイント

Chatterbox Mcp

Chatterbox TTSモデルに基づく簡易MCPサーバーで、テキストを音声に変換して自動再生する機能を提供し、リアルタイムの進捗通知と自動モデルロードをサポートしています。

python

9.7k

2.5ポイント

Kokoro TTS

Kokoro TTSエンジンをベースにした音声合成MCPサービス

python

11.4k

2.5ポイント

Kokoro Tts Mcp

Kokoroテキスト読み上げ（TTS）MCPサーバーで、MP3ファイルの生成とS3ストレージへのアップロードをサポートしています。

python

9.8k

2.5ポイント

DeepCo

Deep - CoはCompose Multiplatformをベースに開発されたクロスプラットフォームチャットクライアントで、OpenRouter、Anthropic、Grok、OpenAIなどの複数のLLM APIプロバイダをサポートし、OpenAI APIとローカルモデルと互換性があります。チャット履歴管理、プロンプト管理、ロール適合、TTSなどの機能を備え、多言語とテーマカスタマイズをサポートしています。

kotlin

15.8k

2.5ポイント