Best 文本转语音模型 AI Tools & Models - Premium 文本转语音模型 News

10k

Chatterbox AI

开源的高质量文本转语音模型，支持情感控制。

16.4k

Octave TTS

Octave TTS 是首个能够理解文本含义的语音合成模型，能够生成富有情感和风格的语音。

13.1k

Zonos-v0.1-hybrid

Zonos-v0.1-hybrid 是一款领先的开源文本转语音模型，能够提供高质量的语音合成服务。

12k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

o3-mini

Openai

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen-image-plus

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

qwen3-livetranslate-flaltimeash-re-2025-09-22

Alibaba

Input tokens/M

$240

Output tokens/M

Context Length

Doubao-Seed-Translation

Bytedance

$1.2

Input tokens/M

$3.6

Output tokens/M

Context Length

MCP

MiniMax

Verified

MiniMax官方模型上下文协议（MCP）服务器，支持文本转语音、视频/图像生成等API交互。

13.9k

4.0points

Mcp Video Extraction

一个基于MCP协议的视频音频文本提取服务器，支持从多平台下载视频并利用Whisper模型进行语音转文字处理

9.5k

Chatterbox Mcp

一个基于Chatterbox TTS模型的简化MCP服务器，提供文本转语音生成及自动播放功能，支持实时进度通知和自动模型加载。

6.8k

ClickSend

一个基于ClickSend API的MCP服务器，提供短信发送和文本转语音电话功能，支持AI模型程序化操作通讯服务。

javascript

8.8k

MiniMax MCP JS

MiniMax MCP JS是一个JavaScript/TypeScript实现的MiniMax模型上下文协议工具包，提供文本转语音、图像生成、视频生成和语音克隆等功能，支持多种配置方式和传输模式。

typescript

6.2k

Groq Mcp Server

Groq MCP Server是一个通过Model Context Protocol（MCP）提供快速模型推理的服务，支持文本生成、语音转换、图像分析和批量处理等多种功能。

8.9k

Mcp Server Whisper

MCP Server Whisper是一个基于OpenAI Whisper和GPT-4o模型的音频处理服务器，提供高级音频转录、格式转换、批量处理和文本转语音等功能，通过Model Context Protocol标准实现与AI助手的无缝交互。