Best 语音转文字模型 AI Tools & Models - Premium 语音转文字模型 News

AI News

延迟低于 0.2 秒！Mistral AI 发布 Voxtral Transcribe 2 语音模型，支持中文实时转录

法国Mistral AI推出Voxtral Transcribe2语音转文字模型系列，包含两款针对不同场景优化的模型。其中，Voxtral Realtime实时转录模型拥有40亿参数，采用流式架构，能在音频输入瞬间同步转录，显著降低延迟和成本。

11.6k 4 hours ago

延迟低于 0.2 秒！Mistral AI 发布 Voxtral Transcribe 2 语音模型，支持中文实时转录

AI Products

ElevenLabs Scribe

Scribe 是全球最准确的语音转文字模型，支持99种语言。

语音识别

13.1k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

o3-mini

Openai

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

qwen3-livetranslate-flaltimeash-re-2025-09-22

Alibaba

Input tokens/M

$240

Output tokens/M

Context Length

Doubao-Seed-Translation

Bytedance

$1.2

Input tokens/M

$3.6

Output tokens/M

Context Length

Qwen3-Next-80B-A3B-Instruct

Alibaba

Input tokens/M

Output tokens/M

256

Context Length

MCP

Mcp Video Extraction

一个基于MCP协议的视频音频文本提取服务器，支持从多平台下载视频并利用Whisper模型进行语音转文字处理

python

9.5k

2.5points

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

延迟低于 0.2 秒！Mistral AI 发布 Voxtral Transcribe 2 语音模型，支持中文实时转录

AI Products

ElevenLabs Scribe

Models

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen3-coder-plus

qwen3-vl-plus

qwen3-vl-235b-a22b-thinking

qwen3-max

Qianfan-Lightning

qwen3-livetranslate-flaltimeash-re-2025-09-22

Doubao-Seed-Translation

Qwen3-Next-80B-A3B-Instruct

Latin_whisper Small

Whisper Large V3 Pt Cv19 Fleurs

Wav2vec2 Large Danish Npsc Nst

Personal Speech To Text Model

MCP

Mcp Video Extraction

AI News

​延迟低于 0.2 秒！Mistral AI 发布 Voxtral Transcribe 2 语音模型，支持中文实时转录

AI Products

ElevenLabs Scribe

Models

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen3-coder-plus

qwen3-vl-plus

qwen3-vl-235b-a22b-thinking

qwen3-max

Qianfan-Lightning

qwen3-livetranslate-flaltimeash-re-2025-09-22

Doubao-Seed-Translation

Qwen3-Next-80B-A3B-Instruct

Latin_whisper Small

Whisper Large V3 Pt Cv19 Fleurs

Wav2vec2 Large Danish Npsc Nst

Personal Speech To Text Model

MCP

Mcp Video Extraction

延迟低于 0.2 秒！Mistral AI 发布 Voxtral Transcribe 2 语音模型，支持中文实时转录