最好的TTS模型 AI工具模型_精選TTS模型資訊

AI資訊

27B數理 SOTA 與3秒情感克隆，有道全面開源“子曰4”多模態與 TTS 引擎

網易有道發佈“子曰”大模型4.0版本，全面升級至全模態時代，支持文本、圖片、音頻融合交互。核心的多模態模型和語音合成（TTS）模型正式開源，翻譯模型經技術重構，翻譯質量與效率顯著提升。多模態模型在視覺和數理領域達到SOTA水平，純文本數理難題性能行業領先。

15.2k 5 小時前

27B數理 SOTA 與3秒情感克隆，有道全面開源“子曰4”多模態與 TTS 引擎

Inworld AI 推出實時 TTS-2：一款適應用戶交流方式的閉環語音模型

Inworld AI發佈實時TTS-2語音模型，通過API預覽版實現突破。與傳統文本轉語音不同，該模型能實時感知用戶語調、節奏和情感，採用閉環系統架構，無需依賴文字轉錄，提供更自然流暢的對話體驗。

15.9k 19 小時前

小米發佈全鏈路語音大模型 MiMo-V2.5，TTS 可“一句話生成新音色”，ASR 開源支持方言與多語混說

小米發佈MiMo-V2.5全鏈路語音模型系列，包括三款TTS模型和一款開源ASR模型，覆蓋語音輸入與輸出。TTS模型能精準調度情緒、語氣和角色身份，讓聲音可編程、可創作、可復刻，提升人機交互自然度，開啓語音智能新紀元。

24.9k 7 小時前

小米 MiMo-V2.5震撼公測:4.3小時手搓編譯器，長程智能體迎“滿分”跨越

小米發佈MiMo-V2.5系列大模型，包含MiMo-V2.5、V2.5-Pro及配套TTS與ASR模型，標誌着模型從“能用”到“好用”的升級。其中旗艦型號MiMo-V2.5-Pro在通用智能體能力和軟件工程方面已能與Claude Opus4.6、GPT-5.4等頂尖模型競爭，核心優勢在於高指令遵循度和自我修正能力。

17.5k 20 小時前

小米 MiMo-V2.5震撼公測:4.3小時手搓編譯器，長程智能體迎“滿分”跨越

AI產品

Miso One

Miso One是Miso Labs推出的英語TTS模型，支持情感語音生成。

文本轉聲音

7.4k

OmniVoice

高質量的語音克隆 TTS 模型，支持 600 多種語言。

文本轉聲音

7.7k

Hathora

提供語音AI的ASR、TTS和LLM模型，可測試部署用於即時應用。

開發平臺

9.2k

Dia AI

一個可以在一次傳遞中生成超逼真的對話的 TTS 模型。

文本轉聲音

16.2k

模型

Gemini 2.0 Flash-Lite

Google

$0.49

輸入tokens/百萬

$2.1

輸出tokens/百萬

上下文長度

GPT-4.1 mini

Openai

$2.8

輸入tokens/百萬

$11.2

輸出tokens/百萬

上下文長度

Grok 4 Fast

Xai

$1.4

輸入tokens/百萬

$3.5

輸出tokens/百萬

上下文長度

o3-mini

Openai

$7.7

輸入tokens/百萬

$30.8

輸出tokens/百萬

200

上下文長度

GPT-5 Codex

Openai

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Claude 3 Opus

Anthropic

$105

輸入tokens/百萬

$525

輸出tokens/百萬

200

上下文長度

Gemini 2.0 Flash

Google

$0.7

輸入tokens/百萬

$2.8

輸出tokens/百萬

上下文長度

Claude Haiku 4.5

Anthropic

輸入tokens/百萬

$35

輸出tokens/百萬

200

上下文長度

Gemini 2.5 Flash

Google

$2.1

輸入tokens/百萬

$17.5

輸出tokens/百萬

上下文長度

Claude Sonnet 4.5

Anthropic

$21

輸入tokens/百萬

$105

輸出tokens/百萬

200

上下文長度

Claude 3 Sonnet

Anthropic

$21

輸入tokens/百萬

$105

輸出tokens/百萬

200

上下文長度

Gemini 2.5 Flash-Lite

Google

$0.7

輸入tokens/百萬

$2.8

輸出tokens/百萬

上下文長度

qwen3-vl-plus

Alibaba

輸入tokens/百萬

$10

輸出tokens/百萬

256

上下文長度

wan2.5-i2i-preview

Alibaba

輸入tokens/百萬

輸出tokens/百萬

上下文長度

qwen3-max

Alibaba

輸入tokens/百萬

$24

輸出tokens/百萬

256

上下文長度

qwen-image-plus

Alibaba

輸入tokens/百萬

輸出tokens/百萬

上下文長度

qwen3-coder-plus

Alibaba

輸入tokens/百萬

$16

輸出tokens/百萬

上下文長度

qwen3-vl-235b-a22b-thinking

Alibaba

輸入tokens/百萬

$20

輸出tokens/百萬

上下文長度

Qianfan-Lightning

Baidu

輸入tokens/百萬

輸出tokens/百萬

128

上下文長度

Doubao-Seed-Translation

Bytedance

$1.2

輸入tokens/百萬

$3.6

輸出tokens/百萬

上下文長度

MCP

Chatterbox Mcp

一個基於Chatterbox TTS模型的簡化MCP服務器，提供文本轉語音生成及自動播放功能，支持即時進度通知和自動模型加載。

python

9.7k

2.5分

DeepCo

Deep-Co是一個基於Compose Multiplatform開發的跨平臺聊天客戶端，支持多種LLM API提供商，包括OpenRouter、Anthropic、Grok、OpenAI等，併兼容OpenAI API和本地模型。具備聊天記錄管理、提示詞管理、角色適配、TTS等功能，支持多語言和主題定製。

kotlin

16.8k

2.5分