阿里通义Qwen团队推出开源Python命令行工具Qwen3-ASR-Toolkit,支持便捷音视频转录。该工具突破Qwen3-ASR-Flash API的三分钟限制,实现小时级快速转录,为大规模音频处理提供有力支持。Qwen3-ASR-Flash是最新语音识别模型,基于海量多模态数据训练。
通义千问推出最新语音识别模型Qwen3-ASR-Flash,基于Qwen3基座模型,经海量多模态数据和数千万小时ASR数据训练,具备高精度、高鲁棒性。核心特性包括领先的识别准确率和出色的歌声识别能力,在多个中英文及多语种基准测试中表现优异。