最好的TTS AI工具模型_精選TTS資訊 - AIBase

AI資訊

27B數理 SOTA 與3秒情感克隆，有道全面開源“子曰4”多模態與 TTS 引擎

網易有道發佈“子曰”大模型4.0版本，全面升級至全模態時代，支持文本、圖片、音頻融合交互。核心的多模態模型和語音合成（TTS）模型正式開源，翻譯模型經技術重構，翻譯質量與效率顯著提升。多模態模型在視覺和數理領域達到SOTA水平，純文本數理難題性能行業領先。

27B數理 SOTA 與3秒情感克隆，有道全面開源“子曰4”多模態與 TTS 引擎

Inworld AI 推出實時 TTS-2：一款適應用戶交流方式的閉環語音模型

Inworld AI發佈實時TTS-2語音模型，通過API預覽版實現突破。與傳統文本轉語音不同，該模型能實時感知用戶語調、節奏和情感，採用閉環系統架構，無需依賴文字轉錄，提供更自然流暢的對話體驗。

Inworld AI 推出實時 TTS-2：一款適應用戶交流方式的閉環語音模型

小米發佈全鏈路語音大模型 MiMo-V2.5，TTS 可“一句話生成新音色”，ASR 開源支持方言與多語混說

小米發佈MiMo-V2.5全鏈路語音模型系列，包括三款TTS模型和一款開源ASR模型，覆蓋語音輸入與輸出。TTS模型能精準調度情緒、語氣和角色身份，讓聲音可編程、可創作、可復刻，提升人機交互自然度，開啓語音智能新紀元。

22.6k 4 小時前

小米發佈全鏈路語音大模型 MiMo-V2.5，TTS 可“一句話生成新音色”，ASR 開源支持方言與多語混說

小米 MiMo-V2.5震撼公測:4.3小時手搓編譯器，長程智能體迎“滿分”跨越

小米發佈MiMo-V2.5系列大模型，包含MiMo-V2.5、V2.5-Pro及配套TTS與ASR模型，標誌着模型從“能用”到“好用”的升級。其中旗艦型號MiMo-V2.5-Pro在通用智能體能力和軟件工程方面已能與Claude Opus4.6、GPT-5.4等頂尖模型競爭，核心優勢在於高指令遵循度和自我修正能力。

小米 MiMo-V2.5震撼公測:4.3小時手搓編譯器，長程智能體迎“滿分”跨越

AI產品

Miso One

Miso One

Miso One是Miso Labs推出的英語TTS模型，支持情感語音生成。

文本轉聲音

KugelAudio

KugelAudio

歐洲首款量產就緒的TTS，40+語言自然語音，歐洲開發託管，GDPR合規

文本轉聲音

OmniVoice

OmniVoice

高質量的語音克隆 TTS 模型，支持 600 多種語言。

文本轉聲音

Noiz ai

Noiz ai

Noiz AI支持聲音克隆、情緒控制，提供多語言TTS及開發者API。

文本轉聲音

模型

qwen3-tts-flash

Alibaba

qwen3-tts-flash

-

輸入tokens/百萬

-

輸出tokens/百萬

-

上下文長度

qwen3-tts-flash-realtime

Alibaba

qwen3-tts-flash-realtime

-

輸入tokens/百萬

-

輸出tokens/百萬

-

上下文長度

qwen-tts-realtime

Alibaba

qwen-tts-realtime

$2.4

輸入tokens/百萬

$12

輸出tokens/百萬

8

上下文長度

qwen-tts

Alibaba

qwen-tts

$1.6

輸入tokens/百萬

$10

輸出tokens/百萬

8

上下文長度

MCP

Kokoro TTS

Kokoro TTS

基於Kokoro TTS引擎的語音合成MCP服務

Zonos TTS

Zonos TTS

Zonos TTS與Claude的MCP集成項目，實現文本轉語音功能。

fish-speech-mcp

Fish Speech Mcp

一個基於FishSpeech的文本轉語音(TTS)MCP服務器，支持語音參考保存，可與Dive等MCP兼容的LLM集成使用。

MCP_tts_server

MCP_tts_server

一個基於MCP框架的多功能TTS服務器，整合了Kokoro本地TTS和OpenAI雲端TTS引擎，支持即時音頻流、語音定製及播放控制。

chatterbox-mcp

Chatterbox Mcp

一個基於Chatterbox TTS模型的簡化MCP服務器，提供文本轉語音生成及自動播放功能，支持即時進度通知和自動模型加載。

kyutai-tts-docker

Kyutai Tts Docker

Kyutai TTS的Docker部署方案，提供一鍵啟動的Web界面、REST API和MCP工具支持，支持GPU加速和多語言界面。

OpenAI TTS

OpenAI TTS

基於OpenAI TTS API的高質量文本轉語音工具與MCP服務

DeepCo

DeepCo

Deep-Co是一個基於Compose Multiplatform開發的跨平臺聊天客戶端，支持多種LLM API提供商，包括OpenRouter、Anthropic、Grok、OpenAI等，併兼容OpenAI API和本地模型。具備聊天記錄管理、提示詞管理、角色適配、TTS等功能，支持多語言和主題定製。

kokoro-tts-mcp

Kokoro Tts Mcp

Kokoro文本轉語音(TTS)MCP服務器，支持生成MP3文件並可選上傳至S3存儲

claude-code-tts

Claude Code Tts

一個為Claude Code設計的文本轉語音MCP服務器插件，使用OpenAI TTS API將文本轉換為語音，提供自動語音反饋功能。

Blabber (OpenAI TTS)

Blabber (OpenAI TTS)

Blabber-MCP是基於OpenAI文本轉語音API的MCP服務器，為LLM提供語音輸出功能。

mcp-tts-say

Mcp Tts Say

一個基於MCP服務器和OpenAI TTS SDK的文本轉語音工具，支持本地環境播放。

Zonos-TTS-MCP-Linux

Zonos TTS MCP Linux

為Claude AI提供Linux系統上的Zonos TTS語音合成集成

tts-mcp-server

Tts Mcp Server

基於MCP的文本轉語音服務器

google-adk-elevenlabs-mcp

Google Adk Elevenlabs Mcp

該項目使用Google ADK和ElevenLabs MCP服務器構建了一個文本轉語音(TTS)的智能體，通過uvx連接實現語音合成功能。

Kokoro Speech

Kokoro Speech

一個基於Kokoro TTS模型的文本轉語音MCP服務器，提供高質量的語音合成服務

windows_tts_mcp

Windows_tts_mcp

Windows TTS MCP Server是一個基於PowerShell的文本轉語音服務，為Claude Desktop提供穩定高效的TTS功能，支持語音控制、速度調節和緊急靜音等操作。

AIBase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AI Marketing LLM Leaderboard AI Ranking

© 2026AIBase

商務合作網站地圖