Best TTS模型 AI Tools & Models - Premium TTS模型 News

AI News

27B数理 SOTA 与3秒情感克隆，有道全面开源“子曰4”多模态与 TTS 引擎

网易有道发布“子曰”大模型4.0版本，全面升级至全模态时代，支持文本、图片、音频融合交互。核心的多模态模型和语音合成（TTS）模型正式开源，翻译模型经技术重构，翻译质量与效率显著提升。多模态模型在视觉和数理领域达到SOTA水平，纯文本数理难题性能行业领先。

13k 3 hours ago

27B数理 SOTA 与3秒情感克隆，有道全面开源“子曰4”多模态与 TTS 引擎

Inworld AI 推出实时 TTS-2：一款适应用户交流方式的闭环语音模型

Inworld AI发布实时TTS-2语音模型，通过API预览版实现突破。与传统文本转语音不同，该模型能实时感知用户语调、节奏和情感，采用闭环系统架构，无需依赖文字转录，提供更自然流畅的对话体验。

15.3k 21 hours ago

小米发布全链路语音大模型 MiMo-V2.5，TTS 可“一句话生成新音色”，ASR 开源支持方言与多语混说

小米发布MiMo-V2.5全链路语音模型系列，包括三款TTS模型和一款开源ASR模型，覆盖语音输入与输出。TTS模型能精准调度情绪、语气和角色身份，让声音可编程、可创作、可复刻，提升人机交互自然度，开启语音智能新纪元。

24.6k 56 minutes ago

小米 MiMo-V2.5震撼公测:4.3小时手搓编译器，长程智能体迎“满分”跨越

小米发布MiMo-V2.5系列大模型，包含MiMo-V2.5、V2.5-Pro及配套TTS与ASR模型，标志着模型从“能用”到“好用”的升级。其中旗舰型号MiMo-V2.5-Pro在通用智能体能力和软件工程方面已能与Claude Opus4.6、GPT-5.4等顶尖模型竞争，核心优势在于高指令遵循度和自我修正能力。

15.9k 8 hours ago

小米 MiMo-V2.5震撼公测:4.3小时手搓编译器，长程智能体迎“满分”跨越

AI Products

Miso One

Miso One是Miso Labs推出的英语TTS模型，支持情感语音生成。

文本转声音

5.4k

OmniVoice

高质量的语音克隆 TTS 模型，支持 600 多种语言。

文本转声音

6.3k

Hathora

提供语音AI的ASR、TTS和LLM模型，可测试部署用于实时应用。

开发平台

10.5k

Dia AI

一个可以在一次传递中生成超逼真的对话的 TTS 模型。

文本转声音

20k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

o3-mini

Openai

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen-image-plus

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

wan2.5-i2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

MCP

DeepCo

Deep-Co是一个基于Compose Multiplatform开发的跨平台聊天客户端，支持多种LLM API提供商，包括OpenRouter、Anthropic、Grok、OpenAI等，并兼容OpenAI API和本地模型。具备聊天记录管理、提示词管理、角色适配、TTS等功能，支持多语言和主题定制。

kotlin

36.1k

2.5points