DSU-AVO

Public

INTERSPEECH 2023 录用论文 DSU-AVO 的源代码和语音样本

expressive-speech-synthesis speech-synthesis

创建时间：2023-05-30T00:33:11

更新时间：2025-02-22T22:25:40

https://ranacm.github.io/DSU-AVO/

Stars

Stars Increase

相关项目

Transformers

Hot

bert

Pytorch、TensorFlow和JAX框架下最先进的机器学习转换器

147733

2年前

+59today

GPT SoVITS

Hot

text-to-speech

仅仅1分钟的语音数据就能训练出一个不错的语音合成模型！（少量样本语音克隆）

49477

2天前

+54today

Whisper.Cpp

inference

OpenAI Whisper 模型的 C/C++ 端口

41918

2天前

+24today

TTS

deep-learning

??：一个用于语音合成的深度学习工具包，经过研究和生产环境的实战检验

41749

6个月前

+23today

ChatTTS

一个用于日常对话的生成式语音模型。

MockingBird

只需5秒钟，AI就能克隆你的声音，并实时生成任何你想要的语音内容。

36503

1个月前

+4today

OpenVoice

text-to-speech

麻省理工学院和MyShell公司研发的即时语音克隆技术，基于音频基础模型。

33728

2天前

+14today

So Vits Svc

软VC VITS歌声转换

27462

2天前

+10today

DeepSpeech

deep-learning

DeepSpeech是一个开源的嵌入式（离线，设备端）语音转文本引擎，它可以在从树莓派4到高性能GPU服务器等各种设备上实时运行。

26544

8个月前

+3today

Datasets

computer-vision

最大的机器学习模型即用型数据集中心，提供快速、易用且高效的数据处理工具

20444

3个月前

+5today

AI开源&商用产品

AI产品提交

模型库

MCP服务端

MCP客户端

MCP服务调试

案例教程

AI热门资讯

今日AI热点