将韵律标注器与Festival语音合成系统集成
最先进的自然语言处理
百度自然语言处理技术(NLP)包含:分词(将句子拆分成单个词语)、词性标注(识别每个词语的词性,例如名词、动词等)、命名实体识别(识别文本中的人名、地名、组织机构名等)、关键词提取(识别句子或文本中最重要的词语)
将一段中文文本拆分成单个词语或词组的过程。
来自CAMB.AI的MARS5语音模型(TTS)
Aeneas是一个Python/C语言库和工具集,能够自动同步音频和文本(也称为强制对齐)。
深度学习中文分词
NCRF++是一个神经序列标注工具包,易于用于任何序列标注任务(例如命名实体识别、词性标注、分词)。它包含字符LSTM/CNN、词语LSTM/CNN和softmax/CRF组件。
Kuromoji是一个独立的、非常易于使用的日语形态分析器,专为搜索引擎设计。
微软认知服务中几种语言的文本转语音API示例代码。
精选波斯语自然语言处理和信息检索工具与资源列表