Best AI语音模型 AI Tools & Models - Premium AI语音模型 News

AI News

输入法进入“大模型”时代：搜狗输入法 AI 用户破亿，语音准确率达 98%

腾讯搜狗输入法发布20.0版本，宣布全面AI化，从工具升级为智能助手。新版本基于大模型重塑交互逻辑，在语音、打字、翻译三大高频场景实现底层技术升级，核心提升在于更准、更快、更聪明。

9.6k 4 hours ago

腾讯搜狗输入法发布 20.0 重磅版本全面AI

腾讯搜狗输入法发布20.0.0纪念版，全面AI化升级。依托腾讯混元大模型，重点提升AI语音、翻译和打字功能。AI语音识别延时降低40%，准确率达98%，方言识别准确率提升30%。

11.4k 12 hours ago

全球首创:京东购物智能体 JoyGlance 正式登陆乐奇 AI 眼镜

京东科技与乐奇Rokid合作推出全球首款智能眼镜购物应用JoyGlance，结合AI大模型与光波导技术，实现语音交互购物，简化用户操作。

12k 5 minutes ago

AI日报：天猫上线AI假图识别模型；百川发布医学模型Baichuan-M3 Plus；Remotion Skills开启一句话做大片时代

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://app.aibase.com/zh1、淘宝天猫出重拳！新版Siri将支持语音与文本双输入，并集成于iOS27及其全线操作系统中，同时借助谷歌Gemini模型提升性能。

23.6k 1 hours ago

AI日报：天猫上线AI假图识别模型；百川发布医学模型Baichuan-M3 Plus；Remotion Skills开启一句话做大片时代

AI Products

Voiceley

Voiceley可免费快速进行AI语音克隆，还能使用语音模型生成语音。

语音克隆

7.5k

LazyTyper

免费、超快速、高准确率且支持多语言的语音打字应用，由Whisper提供支持

语音转文本

7.3k

Hathora

提供语音AI的ASR、TTS和LLM模型，可测试部署用于实时应用。

开发平台

7.7k

Unmute

使用低延迟语音识别和合成模型与 AI 对话。

语音识别

11.2k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

o3-mini

Openai

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen-image-plus

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

wan2.5-i2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

MCP

Mcp Hfspace

mcp-hfspace是一个连接Hugging Face Spaces的MCP服务器，支持图像生成、语音处理、视觉模型等多种AI功能，简化了与Claude Desktop的集成。

typescript

6.4k

3.5points

Voice Recorder (Whisper)

一个基于Whisper模型的语音录制和转录MCP服务器，可作为Goose AI扩展或独立服务运行。

python

10.4k

2.5points

Voice Recorder Mcp Server

一个基于Whisper模型的语音录制和转录MCP服务器，可作为Goose AI扩展或独立运行，支持多种录音场景和模型配置。

python

9.3k

2.5points

Teamspeak Mcp

TeamSpeak MCP是一个基于Model Context Protocol的服务器控制工具，专门用于让AI模型（如Claude）管理TeamSpeak语音服务器。它提供39种功能工具，涵盖用户管理、频道控制、权限配置等全方位操作，支持多种部署方式（PyPI/Docker/本地），实现自动化TeamSpeak管理。

python

7.4k

2.5points