AI开源&商用产品

AI产品提交

模型库

MCP服务端

MCP客户端

MCP服务调试

案例教程

AI热门资讯

今日AI热点

vosk-unity-asr

在Unity中使用Vosk库进行自动语音识别

asr deepspeech speech-recognition speech-to-text stt unity3d

创建时间：2021-11-23T16:05:59

更新时间：2025-07-30T23:22:52

87

Stars

0

Stars Increase

相关项目

Transformers

Pytorch、TensorFlow和JAX框架下最先进的机器学习转换器

GPT SoVITS

仅仅1分钟的语音数据就能训练出一个不错的语音合成模型！（少量样本语音克隆）

Whisper.Cpp

OpenAI Whisper 模型的 C/C++ 端口

TTS

??：一个用于语音合成的深度学习工具包，经过研究和生产环境的实战检验

ChatTTS

一个用于日常对话的生成式语音模型。

MockingBird

只需5秒钟，AI就能克隆你的声音，并实时生成任何你想要的语音内容。

HanLP

dependency-parser

把文字切分成词语，并标注每个词的词性（例如名词、动词）；识别出人名、地名、机构名等命名实体；分析句子中词语之间的语法关系；分析句子的结构成分；分析句子中词语之间的语义关系；标注句子中每个成分的语义角色（例如施事者、受事者）；解决代词指代不明确的问题；转换文本的写作风格；计算文本间的语义相似度；发现新的词语；提取关键词和短语；自动生成文本摘要；对文本进行分类和聚类；进行中文简繁体转换；以及其他自然语言处理技术。

OpenVoice

麻省理工学院和MyShell公司研发的即时语音克隆技术，基于音频基础模型。

SpaCy

Python语言的工业级自然语言处理（NLP）

So Vits Svc

软VC VITS歌声转换