shields
このモデルはfacebook/wav2vec2-large-960hをDementiaBankデータセットでファインチューニングした音声認識モデルで、主に音声からテキストへの変換タスクに使用されます。
facebook/wav2vec2-baseをベースに微調整された音声認識モデルで、TIMITとDementiaBankデータセットで訓練され、英語の音声認識タスクに適しています。