最好的ASR AI工具模型_精選ASR資訊 - AIBase

AI資訊

阿里語音大模型霸榜國際權威榜單，奪得國產語音 AI“三冠王”

2026年5月28日，全球AI評測平臺Artificial Analysis發佈語音排行榜，阿里巴巴的Fun-Realtime-TTS-Preview語音大模型以1190分獲全球第五、國產第一。該模型在ASR等三大核心語音賽道均居國內榜首，展現全面領先實力。

16.4k 20 小時前

阿里語音大模型霸榜國際權威榜單，奪得國產語音 AI“三冠王”

小米發佈全鏈路語音大模型 MiMo-V2.5，TTS 可“一句話生成新音色”，ASR 開源支持方言與多語混說

小米發佈MiMo-V2.5全鏈路語音模型系列，包括三款TTS模型和一款開源ASR模型，覆蓋語音輸入與輸出。TTS模型能精準調度情緒、語氣和角色身份，讓聲音可編程、可創作、可復刻，提升人機交互自然度，開啓語音智能新紀元。

23k 2 分鐘前

小米發佈全鏈路語音大模型 MiMo-V2.5，TTS 可“一句話生成新音色”，ASR 開源支持方言與多語混說

小米 MiMo-V2.5震撼公測:4.3小時手搓編譯器，長程智能體迎“滿分”跨越

小米發佈MiMo-V2.5系列大模型，包含MiMo-V2.5、V2.5-Pro及配套TTS與ASR模型，標誌着模型從“能用”到“好用”的升級。其中旗艦型號MiMo-V2.5-Pro在通用智能體能力和軟件工程方面已能與Claude Opus4.6、GPT-5.4等頂尖模型競爭，核心優勢在於高指令遵循度和自我修正能力。

16.4k 5 小時前

小米 MiMo-V2.5震撼公測:4.3小時手搓編譯器，長程智能體迎“滿分”跨越

微軟開源前沿語音 AI 家族 VibeVoice：單次處理 90 分鐘多說話人對話，GitHub 迅速獲 27K Star

微軟開源VibeVoice語音AI模型，支持ASR和TTS，具備長音頻處理、多說話人對話生成及實時低延遲特性，已在GitHub獲27K星。採用MIT協議，支持本地部署，無需雲端費用，旨在推動語音合成領域創新。

21k 7 小時前

微軟開源前沿語音 AI 家族 VibeVoice：單次處理 90 分鐘多說話人對話，GitHub 迅速獲 27K Star

AI產品

Seed Audio

Seed Audio

Seed Audio AI 含 TTS、ASR 等，通過 API 為創作者和開發者生成音頻

文本轉語音

Hathora

Hathora

提供語音AI的ASR、TTS和LLM模型，可測試部署用於即時應用。

Nexa SDK

Nexa SDK

Nexa SDK可在數分鐘內將AI模型部署到任何設備上，快速、私密且適用於多場景。

模型訓練與部署

PengChengStarling

PengChengStarling

PengChengStarling 是一個基於 icefall 項目的多語言自動語音識別（ASR）模型開發工具包。

模型

Claude Haiku 4.5

Anthropic

Claude Haiku 4.5

$7

輸入tokens/百萬

$35

輸出tokens/百萬

200

上下文長度

qwen3-asr-flash

Alibaba

qwen3-asr-flash

-

輸入tokens/百萬

-

輸出tokens/百萬

-

上下文長度

GLM-4.5-Air

Chatglm

GLM-4.5-Air

-

輸入tokens/百萬

-

輸出tokens/百萬

128

上下文長度

GLM-Z1-Air

Chatglm

GLM-Z1-Air

-

輸入tokens/百萬

-

輸出tokens/百萬

128

上下文長度

MCP

asr_mcp_server

Asr_mcp_server

ASR MCP服務器是一個基於whisper引擎的自動語音識別服務，通過MCP工具提供語音合成功能，便於應用集成。

AIBase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AI Marketing LLM Leaderboard AI Ranking

© 2026AIBase

商務合作網站地圖