发现与 Email Parsing 相关的最受欢迎的开源项目和工具,了解最新的开发趋势和创新。
把文字切分成词语,并标注每个词的词性(例如名词、动词);识别出人名、地名、机构名等命名实体;分析句子中词语之间的语法关系;分析句子的结构成分;分析句子中词语之间的语义关系;标注句子中每个成分的语义角色(例如施事者、受事者);解决代词指代不明确的问题;转换文本的写作风格;计算文本间的语义相似度;发现新的词语;提取关键词和短语;自动生成文本摘要;对文本进行分类和聚类;进行中文简繁体转换;以及其他自然语言处理技术。
构建企业级 RAG(检索增强生成)流水线的统一框架,该框架使用小型专用模型
CoreNLP:一个基于Java的NLP核心工具套件,包含分词、句子分割、命名实体识别、句法分析、共指消解、情感分析等功能。
开放智能体:一个面向真实世界的开放式语言智能体平台(COLM 2024)
一款精准、高效、易用的中文自然语言处理(NLP)预处理和解析工具包,访问 www.jionlp.com 获取更多信息。
fastNLP:一个模块化且可扩展的自然语言处理框架。目前仍在孵化阶段。
使用改进的BiSeNet进行PyTorch人脸解析
免费在线课程:使用spaCy进行高级自然语言处理
用于人工智能驱动日志分析的大型系统日志数据集 [ISSRE'23]
用于日志解析的机器学习工具包(发表在ICSE'19和DSN'16会议上)
Underthesea - 越南语自然语言处理工具包
ExtractThinker是一个面向大型语言模型的文档智能库,它提供类似ORM(对象关系映射)的交互方式,从而实现灵活且强大的文档工作流程。
隆重推出DeToxify——终极毒性消除器。它拥有强大的自然语言处理能力,能够识别有害评论,消除负面情绪,并将毒性言论转化为文明表达。你可以把它想象成你线上空间的贾维斯——一次评论一个地,让互联网变得更友好、更智慧。
数千种最先进的自然语言处理模型,支持数百种语言,是解决文本问题的最快捷、最准确的方法。
FaceXlib的目标是基于当前最新的开源方法,提供一系列现成可用的面部相关功能。
支持11种语言的高精度自然语言处理(NLP)解析器
一个使用PyTorch和Torchtext构建的深度学习框架,用于自然语言处理。
Trankit是一个轻量级的基于Transformer的Python工具包,用于多语言自然语言处理。
支持中文的SpaCy模型
针对机器学习训练优化的多模态OCR流水线(文本、数学公式、表格、图表)