malaysia-ai
Qwen/Qwen3-1.7B-Baseをベースに継続事前学習を行った多言語音声変換とテキスト読み上げモデルで、多言語、複数話者の音声生成と変換機能をサポートします。
X-Codec-2.0-25TPS-24kは、HKUSTAudio/xcodec2を改良した音声コーデックモデルで、毎秒の処理トランザクション数を50から25に低下させると同時に、出力サンプリングレートを24kHzに引き上げ、音声品質を維持しながら処理効率を最適化しています。
Deberta-V3-xsmallをファインチューニングしたマレー語二項感情分析モデルで、肯定的または否定的な感情ラベルを予測可能
mesolitica
マレーシアデータセットでファインチューンされたWhisperベースモデル、マレー語と英語の音声認識をサポート
マレーシアデータセットで蒸留最適化されたWhisper Large V3音声認識モデル、マレー語など複数言語をサポート