Best 语音功能 AI Tools & Models - Premium 语音功能 News

AI News

动动嘴就能订餐厅!千问 App 接入高德扫街榜:AI 化身“真人”代打电话

千问App接入高德扫街榜，推出AI语音代订餐厅功能。用户只需语音说明位置、预算、包厢及家庭友好度等需求，系统即可基于真实商户数据精准筛选。选定后，AI将模拟真人语调自动致电商家沟通。

8.8k 8 hours ago

亚马逊推出 AI 可穿戴设备 Bee，助你记录生活点滴

亚马逊推出AI可穿戴设备Bee，操作简便，一键录音。用户可通过应用自定义按钮功能，如双击标记对话片段、处理对话或同时操作，长按可留语音备忘录或与AI助手对话。Bee具备监听、录音和转写功能，独特之处在于其便捷的交互设计。

11.9k 7 hours ago

智能冰箱新功能：用声音控制开关门

三星Family Hub智能冰箱新增语音开关门功能，用户可通过Bixby语音助手控制冰箱门开关，支持超过90度完全打开，方便烹饪时使用。

8.9k yesterday

夸克AI眼镜首次OTA：AI能力进一步增强，新增图文备忘录等五项功能

夸克AI眼镜于12月31日完成首次OTA升级，新增录音纪要、图文备忘录、多意图理解与执行、蓝环支付及社区服务五大功能，并对翻译、行程查询等既有功能进行优化。通过自研语音增强模型与硬件配置，其录音功能现支持十米范围清晰收音与有效降噪。

13.4k 17 hours ago

AI Products

Artta AI

一体化AI创意平台，集视频、图像、音乐、语音合成等功能于一体。

AI设计工具

6.7k

Levelr

Levelr提供AI音频修复、母带处理、语音隔离与增强等功能。

音频生成

5.2k

Rekam AI

免费的一体化AI语音创作平台，支持文本转语音等功能

文本转声音

6.1k

All Voice Lab

AI音频API，提供文本转语音、语音克隆和声音转换功能。

生成视频

14.1k

Models

o3-mini

Openai

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

wan2.5-i2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-livetranslate-flaltimeash-re-2025-09-22

Alibaba

Input tokens/M

$240

Output tokens/M

Context Length

wan2.5-t2v-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-omni-flash-realtime

Alibaba

$3.9

Input tokens/M

$15.2

Output tokens/M

Context Length

qwen3-omni-30b-a3b-captioner

Alibaba

$15.8

Input tokens/M

$12.7

Output tokens/M

Context Length

qwen3-tts-flash

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-tts-flash-realtime

Alibaba

Input tokens/M

Output tokens/M

Context Length

Doubao-1.5-pro-32k

Bytedance

$0.8

Input tokens/M

Output tokens/M

128

Context Length

qwen3-asr-flash

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen-mt-image

Alibaba

Input tokens/M

Output tokens/M

Context Length

百度蒸汽机2.0音视一体

Baidu

Input tokens/M

Output tokens/M

Context Length

腾讯混元生视频

Tencent

Input tokens/M

Output tokens/M

Context Length

qwen-mt-turbo

Alibaba

$0.7

Input tokens/M

$1.95

Output tokens/M

Context Length

qwen-tts-realtime

Alibaba

$2.4

Input tokens/M

$12

Output tokens/M

Context Length

Hunyuan-TurboS-latest

Tencent

$0.8

Input tokens/M

Output tokens/M

Context Length

Doubao-1.5-thinking-vision-pro

Bytedance

Input tokens/M

Output tokens/M

128

Context Length

qwen-tts

Alibaba

$1.6

Input tokens/M

$10

Output tokens/M

Context Length

QianfanHuijin-8B

Baidu

Input tokens/M

Output tokens/M

Context Length

Pangu-AgentExpert-N1-0.0.2

Huawei

Input tokens/M

Output tokens/M

Context Length

MCP

Mcp Hfspace

mcp-hfspace是一个连接Hugging Face Spaces的MCP服务器，支持图像生成、语音处理、视觉模型等多种AI功能，简化了与Claude Desktop的集成。

typescript

6.4k

3.5points

MiniMax MCP

MiniMax-MCP是一个多功能服务器项目，提供文本转语音、视频生成和图像生成等API服务，支持开发者集成高级多媒体功能。

python

9.9k

2.5points

Bouyomichan Mcp Nodejs

这是一个基于Node.js的MCP服务器项目，通过Model Context Protocol实现AI助手与棒読みちゃん语音合成软件的集成，提供文本转语音功能。

javascript

9.9k

2.5points

Zonos TTS

Zonos TTS与Claude的MCP集成项目，实现文本转语音功能。

typescript

9.2k

2.5points

Speech Mcp

Speech MCP是为Goose设计的语音交互扩展，提供实时语音识别、高质量文本转语音、多语言支持和现代化音频可视化界面，支持多角色对话生成和音频转录功能。

python

10.3k

2.5points

Voicemode

Voice Mode是一个为AI助手提供自然语音对话功能的工具，支持与Claude、ChatGPT等LLM通过MCP协议进行人机语音交互。

python

8.7k

2.5points

Rime Text To Speech

一个基于Rime API的文本转语音MCP服务器，提供系统音频播放功能。

typescript

9.2k

2.5points

Mcp Lwh

MCP服务工具集合，提供Hugging Face和Dify的AI服务API调用功能，支持多种NLP、CV和语音处理任务。

typescript

10.2k

2.5points

Teamspeak Mcp

TeamSpeak MCP是一个基于Model Context Protocol的服务器控制工具，专门用于让AI模型（如Claude）管理TeamSpeak语音服务器。它提供39种功能工具，涵盖用户管理、频道控制、权限配置等全方位操作，支持多种部署方式（PyPI/Docker/本地），实现自动化TeamSpeak管理。

python

7.4k

2.5points