在Unity中使用Vosk库进行自动语音识别
Pytorch、TensorFlow和JAX框架下最先进的机器学习转换器
仅仅1分钟的语音数据就能训练出一个不错的语音合成模型!(少量样本语音克隆)
OpenAI Whisper 模型的 C/C++ 端口
??:一个用于语音合成的深度学习工具包,经过研究和生产环境的实战检验
一个用于日常对话的生成式语音模型。
只需5秒钟,AI就能克隆你的声音,并实时生成任何你想要的语音内容。
把文字切分成词语,并标注每个词的词性(例如名词、动词);识别出人名、地名、机构名等命名实体;分析句子中词语之间的语法关系;分析句子的结构成分;分析句子中词语之间的语义关系;标注句子中每个成分的语义角色(例如施事者、受事者);解决代词指代不明确的问题;转换文本的写作风格;计算文本间的语义相似度;发现新的词语;提取关键词和短语;自动生成文本摘要;对文本进行分类和聚类;进行中文简繁体转换;以及其他自然语言处理技术。
麻省理工学院和MyShell公司研发的即时语音克隆技术,基于音频基础模型。
Python语言的工业级自然语言处理(NLP)
软VC VITS歌声转换