parakeet-tdt-0.6b-v2
一款高质量的英语自动语音识别模型,支持标点符号和时间戳预测。
普通产品生产力自动语音识别深度学习
parakeet-tdt-0.6b-v2 是一个 600 百万参数的自动语音识别(ASR)模型,旨在实现高质量的英语转录,具有准确的时间戳预测和自动标点符号、大小写支持。该模型基于 FastConformer 架构,能够高效地处理长达 24 分钟的音频片段,适合开发者、研究人员和各行业应用。
parakeet-tdt-0.6b-v2 最新流量情况
月总访问量
23904807
跳出率
43.33%
平均页面访问数
5.8
平均访问时长
00:04:51