shiwangi27
facebook/wav2vec2-large-xlsr-53モデルをベースにファインチューニングしたヒンディー語音声認識モデルで、OpenSLRとCommon Voiceのヒンディー語データセットを使用して訓練され、16kHzサンプリングレートの音声入力をサポートします。