Best AI文本转语音 AI Tools & Models - Premium AI文本转语音 News

AI News

Gemini TTS 2.5正式上线：Google推情绪级语音，24语种+多角色一键切换

Google推出Gemini 2.5 Flash与Pro文本转语音预览模型，全面升级5月旧版。新模型支持24种语言的多角色对话，具备“情绪级”表达和自适应节奏功能，用户可一键切换“欢快乐观”或“阴郁严肃”等音色。开发者现可在Google AI Studio与Playground免费测试，预计2025年第一季度投入生产，适用于有声书、游戏NPC及本地化课程等场景。

16.7k 40 minutes ago

Gemini TTS 2.5正式上线：Google推情绪级语音，24语种+多角色一键切换

Pebble 创始人推出售价 75 美元的 AI 智能戒指，轻松记录灵感与提醒

Pebble创始人推出AI智能戒指Index01，售价75美元。用户按压戒指按钮即可快速记录备忘，无需依赖始终在线的AI设备。戒指通过手机上的开源语音转文本模型实现AI功能。

12.6k 2 days ago

Step-Audio-EditX 发布:30亿参数音频 LLM 打开语音“可编辑时代”

StepFun AI发布开源项目Step-Audio-EditX，基于30亿参数音频语言模型，将语音编辑转化为类似文本标记的可控操作，突破传统波形处理模式。该技术有望实现"像编辑文本一样编辑语音"的直观交互，相关论文已发布于arXiv平台（编号2511.03601）。

12.4k 1 hours ago

StepFun AI 推出开源音频编辑模型 Step-Audio-EditX，实现音频编辑新体验

StepFun AI发布开源音频编辑模型Step-Audio-EditX，该3B参数模型将音频编辑转化为类似文本编辑的令牌操作，实现直接可控的语音编辑。它解决了当前零样本文本转语音系统在情感、风格等控制上的局限，使表达性语音编辑更简单精确。

10.6k yesterday

AI Products

Genspark Speakly

AI语音听写应用，比打字快4倍，可将语音转化为清晰文本。

语音转文本

6.9k

Rekam AI

免费的一体化AI语音创作平台，支持文本转语音等功能

文本转声音

5.1k

Nepvox AI

尼泊尔首个AI内容创作平台，支持TTS、STT、文本转图像，有500+语音、100+语言。

文案生成器

5.6k

OpenWispr

将您的语音立即转换为文本。完全私密，开源，由AI技术驱动。

语音转文本

6.1k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

o3-mini

Openai

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen-image-plus

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

wan2.5-i2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-livetranslate-flaltimeash-re-2025-09-22

Alibaba

Input tokens/M

$240

Output tokens/M

Context Length

Doubao-Seed-Translation

Bytedance

$1.2

Input tokens/M

$3.6

Output tokens/M

Context Length

MCP

Bouyomichan Mcp Nodejs

这是一个基于Node.js的MCP服务器项目，通过Model Context Protocol实现AI助手与棒読みちゃん语音合成软件的集成，提供文本转语音功能。

javascript

9.9k

2.5points

Mcp Simple Aivisspeech

一个为AivisSpeech文本转语音引擎设计的MCP服务器，支持日语语音合成、多角色声音选择和参数配置，实现与AI助手的无缝集成。

typescript

4.9k

2.5points

ClickSend

一个基于ClickSend API的MCP服务器，提供短信发送和文本转语音电话功能，支持AI模型程序化操作通讯服务。

javascript

8.8k

2.5points

Minimax AI

Minimax MCP Tools是一个集成Minimax API的MCP服务器实现，提供AI图像生成和文本转语音功能，支持与Windsurf编辑器无缝集成。

javascript

9.8k

2.5points

Minimax Mcp Tools

Minimax MCP Tools是一个集成Minimax AI能力的MCP服务器实现，提供图像生成和文本转语音功能。

javascript

9.8k

2.5points

Mcp Make Sound

一个为macOS提供全面音频播放功能的MCP服务器，支持系统声音、文本转语音和自定义音频文件播放，适用于AI助手等MCP客户端。

typescript

7.2k

2.0points

Mcp Server Hume

Hume MCP服务器是一个AI协作工具，允许用户通过MCP客户端应用（如Claude Desktop、Cursor等）使用Octave文本转语音技术，实现智能语音合成与交互。

typescript

7.4k

2.0points

Resemble

一个基于Resemble AI语音生成API的服务器实现，支持通过MCP协议与Claude和Cursor集成，提供文本转语音功能。

python

9.7k

2.0points

Mcp Server Whisper

MCP Server Whisper是一个基于OpenAI Whisper和GPT-4o模型的音频处理服务器，提供高级音频转录、格式转换、批量处理和文本转语音等功能，通过Model Context Protocol标准实现与AI助手的无缝交互。

python

9.8k

2.0points

Smallest Ai Mcp

Smallest AI MCP Server是一个生产级的ModelContextProtocol服务器，专为Waves文本转语音和语音克隆平台设计，提供快速、安全的AI语音工作流解决方案。

python

6.7k

2.0points

Bouyomi Mcp Nodejs

这是一个基于Node.js的MCP服务器项目，通过Model Context Protocol实现AI助手与棒読みちゃん语音合成软件的集成，提供文本转语音功能，支持音色、音量、语速等参数调整。

javascript

6.8k

2.0points

Voice Gen Mcp

基于Minimax AI和Amazon S3的语音生成MCP服务器，提供文本转语音功能并自动上传音频文件到云端存储

python

2.0points

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

Gemini TTS 2.5正式上线：Google推情绪级语音，24语种+多角色一键切换

​Pebble 创始人推出售价 75 美元的 AI 智能戒指，轻松记录灵感与提醒

Step-Audio-EditX 发布:30亿参数音频 LLM 打开语音“可编辑时代”

StepFun AI 推出开源音频编辑模型 Step-Audio-EditX，实现音频编辑新体验

AI Products

Genspark Speakly

Rekam AI

Nepvox AI

OpenWispr

Models

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen-image-plus

qwen3-coder-plus

qwen3-max

Qianfan-Lightning

wan2.5-i2i-preview

qwen-image-edit

qwen3-livetranslate-flaltimeash-re-2025-09-22

Doubao-Seed-Translation

VieNeu TTS

Thewhisper Large V3 Turbo

Thewhisper Large V3

Kani Tts 400m Es

Kani Tts 400m Ar

Kani Tts 400m En

Kani Tts 370m

Neutts Air Q8 Gguf

Neutts Air Q4 Gguf

Neutts Air

Soundwave

Piper Vasco

Mms Tts Nya

Mms Tts Fas

Mms Tts Heb

Wav2vec Osr

MCP

Bouyomichan Mcp Nodejs

Mcp Simple Aivisspeech

ClickSend

Minimax AI

Minimax Mcp Tools

Mcp Make Sound

Mcp Server Hume

Resemble

Mcp Server Whisper

Smallest Ai Mcp

Bouyomi Mcp Nodejs

Voice Gen Mcp

Pebble 创始人推出售价 75 美元的 AI 智能戒指，轻松记录灵感与提醒