最好的TTS AI工具模型_精选TTS资讯

AI资讯

27B数理 SOTA 与3秒情感克隆，有道全面开源“子曰4”多模态与 TTS 引擎

网易有道发布“子曰”大模型4.0版本，全面升级至全模态时代，支持文本、图片、音频融合交互。核心的多模态模型和语音合成（TTS）模型正式开源，翻译模型经技术重构，翻译质量与效率显著提升。多模态模型在视觉和数理领域达到SOTA水平，纯文本数理难题性能行业领先。

12.4k 17 小时前

27B数理 SOTA 与3秒情感克隆，有道全面开源“子曰4”多模态与 TTS 引擎

Inworld AI 推出实时 TTS-2：一款适应用户交流方式的闭环语音模型

Inworld AI发布实时TTS-2语音模型，通过API预览版实现突破。与传统文本转语音不同，该模型能实时感知用户语调、节奏和情感，采用闭环系统架构，无需依赖文字转录，提供更自然流畅的对话体验。

14.8k 前天

小米发布全链路语音大模型 MiMo-V2.5，TTS 可“一句话生成新音色”，ASR 开源支持方言与多语混说

小米发布MiMo-V2.5全链路语音模型系列，包括三款TTS模型和一款开源ASR模型，覆盖语音输入与输出。TTS模型能精准调度情绪、语气和角色身份，让声音可编程、可创作、可复刻，提升人机交互自然度，开启语音智能新纪元。

23.3k 7 小时前

小米 MiMo-V2.5震撼公测:4.3小时手搓编译器，长程智能体迎“满分”跨越

小米发布MiMo-V2.5系列大模型，包含MiMo-V2.5、V2.5-Pro及配套TTS与ASR模型，标志着模型从“能用”到“好用”的升级。其中旗舰型号MiMo-V2.5-Pro在通用智能体能力和软件工程方面已能与Claude Opus4.6、GPT-5.4等顶尖模型竞争，核心优势在于高指令遵循度和自我修正能力。

15.4k 3 小时前

小米 MiMo-V2.5震撼公测:4.3小时手搓编译器，长程智能体迎“满分”跨越

AI产品

Seed Audio

Seed Audio AI 含 TTS、ASR 等，通过 API 为创作者和开发者生成音频

音频生成

4.1k

Miso One

Miso One是Miso Labs推出的英语TTS模型，支持情感语音生成。

文本转声音

6.3k

KugelAudio

欧洲首款量产就绪的TTS，40+语言自然语音，欧洲开发托管，GDPR合规

文本转声音

6.7k

OmniVoice

高质量的语音克隆 TTS 模型，支持 600 多种语言。

文本转声音

模型

qwen3-tts-flash

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

qwen3-tts-flash-realtime

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

qwen-tts-realtime

Alibaba

$2.4

输入tokens/百万

$12

输出tokens/百万

上下文长度

qwen-tts

Alibaba

$1.6

输入tokens/百万

$10

输出tokens/百万

上下文长度

MCP

Kokoro Tts Mcp

Kokoro文本转语音(TTS)MCP服务器，支持生成MP3文件并可选上传至S3存储

python

10.3k

2.5分

Zonos TTS

Zonos TTS与Claude的MCP集成项目，实现文本转语音功能。

typescript

10.2k

2.5分

DeepCo

Deep-Co是一个基于Compose Multiplatform开发的跨平台聊天客户端，支持多种LLM API提供商，包括OpenRouter、Anthropic、Grok、OpenAI等，并兼容OpenAI API和本地模型。具备聊天记录管理、提示词管理、角色适配、TTS等功能，支持多语言和主题定制。

kotlin

35.4k

2.5分