malaysia-ai
基於Qwen/Qwen3-1.7B-Base進行繼續預訓練的多語言語音轉換和文本轉語音模型,支持多語言、多說話人的語音生成和轉換功能。
X-Codec-2.0-25TPS-24k是基於HKUSTAudio/xcodec2改進的語音編解碼模型,將每秒處理事務數從50降低到25,同時將輸出採樣率提升至24kHz,在保持語音質量的同時優化了處理效率。
基於Deberta-V3-xsmall微調的馬來語二元情感分析模型,支持預測積極或消極情感標籤
mesolitica
基於馬來西亞數據集微調的Whisper基礎模型,支持馬來語和英語的語音識別
基於馬來西亞數據集蒸餾優化的Whisper Large V3語音識別模型,支持馬來語等多種語言