发现与 Multilingual Summarization 相关的最受欢迎的开源项目和工具,了解最新的开发趋势和创新。
一个AI编排框架,用于构建可定制、可用于生产环境的大型语言模型(LLM)应用。它能够将组件(模型、向量数据库、文件转换器)连接到管道或代理,从而与您的数据进行交互。借助先进的检索方法,它最适合构建基于检索的增强生成(RAG)系统、问答系统、语义搜索或对话式智能体聊天机器人。
利用动态AI模型和声音克隆技术,将电子书转换成包含章节和元数据的有声书,支持1107多种语言!
MyShell.ai 提供的高质量多语言文本转语音库,支持英语、西班牙语、法语、中文、日语和韩语。
多语言语音理解模型
查找所有中文自然语言处理(NLP)数据集,并列出常用的英文NLP数据集
用于自动摘要文本文档和HTML网页的模块。
AdalFlow:构建和自动优化大型语言模型 (LLM) 应用的库。
LightSeq:一个用于序列处理和生成的,高性能库
支持多种语言的自动语音识别,并提供单词级别的时间戳和置信度
用于文本分析的工具,包含文本清理、新词识别、情感分析、实体识别与链接、关键词提取、知识提取和句法分析等功能,并支持无监督或弱监督学习方法。
一个模块化的强化学习库,用于根据人类偏好微调语言模型
收集用于自然语言处理 (NLP) 问题的机器学习和 TensorFlow 深度学习模型,TensorFlow 版本在 1.13 到 2.0 之间。
高效的检索增强与生成框架
CodeTF:一个集多种功能于一身的 Transformer 库,用于最先进的代码大型语言模型
基于BERT的简单易用的抽取式文本摘要方法
通过爬取arXiv论文并总结摘要,返回最新的研究成果。帮助你应对每天大量的论文更新,及时了解最新研究进展。
文本摘要攻略
一个用于运行情境化主题建模的Python包。情境化主题模型 (CTM) 将情境化嵌入(例如,BERT)与主题模型相结合,以获得连贯的主题。发表于EACL和ACL 2021(Bianchi等人)。
基于字节对编码 (BPE) 的 275 种语言预训练子词嵌入
基于GPT2的中文新闻标题生成项目,附带超详细注释