INTERSPEECH 2023 录用论文 DSU-AVO 的源代码和语音样本
Pytorch、TensorFlow和JAX框架下最先进的机器学习转换器
仅仅1分钟的语音数据就能训练出一个不错的语音合成模型!(少量样本语音克隆)
OpenAI Whisper 模型的 C/C++ 端口
??:一个用于语音合成的深度学习工具包,经过研究和生产环境的实战检验
一个用于日常对话的生成式语音模型。
只需5秒钟,AI就能克隆你的声音,并实时生成任何你想要的语音内容。
麻省理工学院和MyShell公司研发的即时语音克隆技术,基于音频基础模型。
软VC VITS歌声转换
DeepSpeech是一个开源的嵌入式(离线,设备端)语音转文本引擎,它可以在从树莓派4到高性能GPU服务器等各种设备上实时运行。
最大的机器学习模型即用型数据集中心,提供快速、易用且高效的数据处理工具