阿里通義Qwen團隊推出開源Python命令行工具Qwen3-ASR-Toolkit,支持便捷音視頻轉錄。該工具突破Qwen3-ASR-Flash API的三分鐘限制,實現小時級快速轉錄,爲大規模音頻處理提供有力支持。Qwen3-ASR-Flash是最新語音識別模型,基於海量多模態數據訓練。
通義千問推出最新語音識別模型Qwen3-ASR-Flash,基於Qwen3基座模型,經海量多模態數據和數千萬小時ASR數據訓練,具備高精度、高魯棒性。核心特性包括領先的識別準確率和出色的歌聲識別能力,在多箇中英文及多語種基準測試中表現優異。