发现与 Gender Recognition 相关的最受欢迎的开源项目和工具,了解最新的开发趋势和创新。
Pytorch、TensorFlow和JAX框架下最先进的机器学习转换器
OpenAI Whisper 模型的 C/C++ 端口
把文字切分成词语,并标注每个词的词性(例如名词、动词);识别出人名、地名、机构名等命名实体;分析句子中词语之间的语法关系;分析句子的结构成分;分析句子中词语之间的语义关系;标注句子中每个成分的语义角色(例如施事者、受事者);解决代词指代不明确的问题;转换文本的写作风格;计算文本间的语义相似度;发现新的词语;提取关键词和短语;自动生成文本摘要;对文本进行分类和聚类;进行中文简繁体转换;以及其他自然语言处理技术。
Python语言的工业级自然语言处理(NLP)
开箱即用的OCR,支持80多种语言和所有流行的文字系统,包括拉丁文、中文、阿拉伯文、天城文、西里尔文等等。
DeepSpeech是一个开源的嵌入式(离线,设备端)语音转文本引擎,它可以在从树莓派4到高性能GPU服务器等各种设备上实时运行。
先进的二维和三维人脸分析项目
这是一个用于追踪自然语言处理 (NLP) 领域进展的资源库,包含数据集以及最常见 NLP 任务的当前最新技术水平。
一个轻量级的Python人脸识别和面部属性分析库(年龄、性别、情绪和种族)
HiVision证件照:一款轻巧高效的AI证件照制作工具。
基于 TensorFlow.js 的浏览器和 Node.js 人脸检测与识别 JavaScript API
WhisperX:带单词级时间戳(和说话人识别)的自动语音识别
Leon 是一款开源的个人助理。
基于深度神经网络的人脸识别
一个可扩展的生成式AI框架,专为从事大型语言模型、多模态和语音AI(自动语音识别和文本转语音)研究和开发的科研人员和开发者而设计。
Kaldi语音识别工具的官方项目地址是kaldi-asr/kaldi。
最先进的深度学习脚本,按模型分类整理,易于在企业级基础设施上进行训练和部署,并具有可复现的准确性和性能。
使用TensorFlow进行人脸识别
基于PaddlePaddle的目标检测工具包。它支持目标检测、实例分割、多目标跟踪和实时多人关键点检测。
适用于Android、iOS、树莓派和服务器的离线语音识别API,支持Python、Java、C#和Node.js。