malaysia-ai
基于Qwen/Qwen3-1.7B-Base进行继续预训练的多语言语音转换和文本转语音模型,支持多语言、多说话人的语音生成和转换功能。
X-Codec-2.0-25TPS-24k是基于HKUSTAudio/xcodec2改进的语音编解码模型,将每秒处理事务数从50降低到25,同时将输出采样率提升至24kHz,在保持语音质量的同时优化了处理效率。
基于Deberta-V3-xsmall微调的马来语二元情感分析模型,支持预测积极或消极情感标签
mesolitica
基于马来西亚数据集微调的Whisper基础模型,支持马来语和英语的语音识别
基于马来西亚数据集蒸馏优化的Whisper Large V3语音识别模型,支持马来语等多种语言