发现与 Text Reranking 相关的最受欢迎的开源项目和工具,了解最新的开发趋势和创新。
Stable Diffusion 的网页版界面
一个超高速的搜索引擎API,将人工智能驱动的混合搜索功能带到您的网站和应用程序中。
仅仅1分钟的语音数据就能训练出一个不错的语音合成模型!(少量样本语音克隆)
OpenAI Whisper 模型的 C/C++ 端口
??:一个用于语音合成的深度学习工具包,经过研究和生产环境的实战检验
一个用于日常对话的生成式语音模型。
只需5秒钟,AI就能克隆你的声音,并实时生成任何你想要的语音内容。
把文字切分成词语,并标注每个词的词性(例如名词、动词);识别出人名、地名、机构名等命名实体;分析句子中词语之间的语法关系;分析句子的结构成分;分析句子中词语之间的语义关系;标注句子中每个成分的语义角色(例如施事者、受事者);解决代词指代不明确的问题;转换文本的写作风格;计算文本间的语义相似度;发现新的词语;提取关键词和短语;自动生成文本摘要;对文本进行分类和聚类;进行中文简繁体转换;以及其他自然语言处理技术。
开源免费的替代方案,可替代OpenAI、Claude等。支持本地自托管,无需GPU,可在家用硬件上运行。可直接替换OpenAI,支持gguf、transformers、diffusers等多种模型架构。功能包括:文本、音频、视频、图像生成,语音克隆,分布式和P2P推理。
麻省理工学院和MyShell公司研发的即时语音克隆技术,基于音频基础模型。
Python语言的工业级自然语言处理(NLP)
Diffusers:一个基于PyTorch和FLAX的库,包含最先进的扩散模型,用于图像、视频和音频生成。
开箱即用的OCR,支持80多种语言和所有流行的文字系统,包括拉丁文、中文、阿拉伯文、天城文、西里尔文等等。
DeepSpeech是一个开源的嵌入式(离线,设备端)语音转文本引擎,它可以在从树莓派4到高性能GPU服务器等各种设备上实时运行。
一款热门的AI驱动型数据库工具和SQL客户端,拥有强大的图形界面,支持MySQL、Oracle、PostgreSQL、DB2、SQL Server、SQLite、H2、ClickHouse等多种数据库。
与你的数据库或数据湖(SQL、CSV、Parquet)对话。PandasAI 使用大型语言模型 (LLM) 和检索增强生成 (RAG) 技术,让数据分析像日常对话一样简单。
与你的SQL数据库聊天? 使用基于检索增强生成(RAG)的大型语言模型(LLM)实现精准的文本转SQL生成?
精选的自然语言处理 (NLP) 资源列表
WhisperX:带单词级时间戳(和说话人识别)的自动语音识别
Leon 是一款开源的个人助理。