Best AI语音 AI Tools & Models - Premium AI语音 News

AI News

小米AI全栈布局进入爆发期，系统级智能助手MiClaw开启端侧新范式

小米2025年财报显示，总收入4573亿元，同比增长25%，调整后净利润392亿元，大增43.8%。公司预测2026年为AI应用爆发年，正加速将大模型、多模态技术与“人车家全生态”深度融合，已完成基础模型布局，自研大模型已在语音、语言等领域应用。

8.8k just now

全球首个全模态订阅！MiniMax 发布 Token Plan：视频语音绘图一包搞定

国产AI公司MiniMax升级编程订阅计划为全球首个全模态模型订阅服务，覆盖视频、语音、音乐和图像生成，旨在提供全能服务并降低成本。

10.2k 2 hours ago

全球首个全模态订阅！MiniMax 发布 Token Plan：视频语音绘图一包搞定

ElevenLabs推出AI音乐交易市场，首创“创作者分成”商业模式

ElevenLabs于2026年3月推出AI音乐交易市场，用户可利用其AI音乐模型创作并销售曲目，将语音克隆的成功商业模式扩展至音频领域。创作者上传原创AI歌曲后，可通过下载、混音或授权获得收益。此前，其语音市场已向创作者支付超1100万美元，音乐模型已生成近1400万首歌曲。

11.9k 4 hours ago

谷歌力推“氛围设计”：Stitch 迎来更新，支持语音驱动 UI 开发

谷歌AI编程工具Stitch推出重大更新，引入语音功能，推动“氛围设计”概念。UI设计正从手动建模转向更直观的交互模式。核心在于语音驱动开发，用户可通过语音指令直接修改界面。

11.7k 3 hours ago

AI Products

voiceslab

Voiceslab可免费即时创建AI语音，通过语音克隆保留音色与口音。

语音克隆

6.6k

Lemon

Lemon是首个将语音指令转化为完成任务的AI代理，免切换标签操作。

效率工具

5.7k

FineVoice Text to Speech

FineVoice可将文本转换为超1500种逼真AI语音，支持风格、速度等多方面自定义。

文本转声音

6.8k

Vois

支持23种语言，63+自然AI语音，可克隆语音，离线桌面使用，每月9美元起。

音频生成

5.7k

Models

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen-image-plus

Alibaba

Input tokens/M

Output tokens/M

Context Length

wan2.5-i2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-livetranslate-flaltimeash-re-2025-09-22

Alibaba

Input tokens/M

$240

Output tokens/M

Context Length

Doubao-Seed-Translation

Bytedance

$1.2

Input tokens/M

$3.6

Output tokens/M

Context Length

Qwen3-Next-80B-A3B-Instruct

Alibaba

Input tokens/M

Output tokens/M

256

Context Length

wan2.5-t2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

wan2.5-t2v-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

wan2.5-i2v-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-omni-flash-realtime

Alibaba

$3.9

Input tokens/M

$15.2

Output tokens/M

Context Length

MCP

Mcp Hfspace

mcp-hfspace是一个连接Hugging Face Spaces的MCP服务器，支持图像生成、语音处理、视觉模型等多种AI功能，简化了与Claude Desktop的集成。

typescript

7.9k

3.5points

Voice Recorder (Whisper)

一个基于Whisper模型的语音录制和转录MCP服务器，可作为Goose AI扩展或独立服务运行。

python

2.5points

Systemprompt Code Orchestrator

SystemPrompt Coding Agent 是一个开源项目，将本地工作站转变为可通过MCP协议远程控制的AI编程助手，支持语音命令和移动端操作，实现异地编程管理。

typescript

8.7k

2.5points

Bouyomichan Mcp Nodejs

这是一个基于Node.js的MCP服务器项目，通过Model Context Protocol实现AI助手与棒読みちゃん语音合成软件的集成，提供文本转语音功能。

javascript

9.3k

2.5points

Jarvis Mcp

Jarvis MCP是一个基于浏览器的语音对话工具，让用户能通过麦克风与AI助手进行自然语音对话，支持30多种语言识别和远程访问，无需额外安装软件或API密钥。

typescript

6.1k

2.5points

Voicemode

Voice Mode是一个为AI助手提供自然语音对话功能的工具，支持与Claude、ChatGPT等LLM通过MCP协议进行人机语音交互。

python

10.6k

2.5points

Chatty Mcp

Chatty MCP是一款为编辑器设计的语音交互插件，能在完成AI请求后通过语音总结操作内容，提升多任务处理效率，支持自定义语音引擎。

typescript

9.3k

2.5points

Mcp Lwh

MCP服务工具集合，提供Hugging Face和Dify的AI服务API调用功能，支持多种NLP、CV和语音处理任务。

typescript

9.9k

2.5points

Rime Text To Speech

一个基于Rime API的文本转语音MCP服务器，提供系统音频播放功能。

typescript

9.9k

2.5points

Voice Recorder Mcp Server

一个基于Whisper模型的语音录制和转录MCP服务器，可作为Goose AI扩展或独立运行，支持多种录音场景和模型配置。

python

9.3k

2.5points

Votars

Votars MCP是一个支持多语言实现的工具，用于与Votars AI平台集成，处理语音转录和AI任务。

9.8k

2.5points

Mcp Simple Aivisspeech

一个为AivisSpeech文本转语音引擎设计的MCP服务器，支持日语语音合成、多角色声音选择和参数配置，实现与AI助手的无缝集成。

typescript

6.3k

2.5points

Teamspeak Mcp

TeamSpeak MCP是一个基于Model Context Protocol的服务器控制工具，专门用于让AI模型（如Claude）管理TeamSpeak语音服务器。它提供39种功能工具，涵盖用户管理、频道控制、权限配置等全方位操作，支持多种部署方式（PyPI/Docker/本地），实现自动化TeamSpeak管理。

python

7.8k

2.5points