发现与 Ngram 相关的最受欢迎的开源项目和工具,了解最新的开发趋势和创新。
四个用Python实现的词嵌入模型,支持任意上下文特征。
轻量级BERT模型用于自监督学习语言表示
用JavaScript进行下一个词元预测——构建快速语言和扩散模型
使用Python实现N元语法语言模型,包含拉普拉斯平滑和句子生成功能。
用于评估预测性语言模型的库和工具
一个Python库,用于从自然语言语料库中提取多层次说话人之间定量、可复现的对齐度量指标。
基于n-gram概率模型和多种平滑技术的词预测
本研究采用传统方法(N-gram、隐马尔可夫模型HMM等)、神经网络方法(卷积神经网络CNN、长短期记忆网络LSTM等)以及预训练模型方法(BERT等)实现了中文分词任务。
多进程无监督中文词语检测与N元语法组合
一款精准、快速、轻量级、多语言支持、免费且开源的下一个词预测库
基于N元语法模型和平滑技术的语言模型
基于PyTorch的神经网络N元语言模型
我整理并收集了一些关于自然语言处理学习内容的例子。
一个提供语义相似性搜索的网络服务,它包含一个网页界面和一个RESTful API。
一个用于自然语言处理的 Go 语言 n-gram 索引器,具有模块化的分词器和数据存储
几种词语表示方法在构建语言模型中的比较
Add n-gram and LLM language model support to HF Transformers Whisper models.
DataCamp上所有与自然语言处理(NLP)相关的课程
Open Source JavaScript based language model, ngram, counter, and other relevant classes. Email us code@grokjs.com