发现与 Cleora Embeddings 相关的最受欢迎的开源项目和工具,了解最新的开发趋势和创新。
AI智能体的记忆层
Qdrant 是一款高性能、大规模的向量数据库和向量搜索引擎,专为下一代人工智能而设计。云端版本也已上线:https://cloud.qdrant.io/
基于人工智能的开源嵌入式数据库
包含一百多种预训练好的中文词向量
与本地GPT进行私密聊天,支持文档、图片、视频等多种格式。100% 保护隐私,采用 Apache 2.0 许可证。支持 oLLaMa、Mixtral、llama.cpp 等多种模型。演示地址:https://gpt.h2o.ai/ https://gpt-docs.h2o.ai/
一个开源的、一体化的向量数据库,用于语义搜索、大型语言模型编排和语言模型工作流。
检索模型和增强型检索大语言模型
LangChain 的 Java 版本
利用BERT和c-TF-IDF技术提取易于理解的主题。
使用GPU加速的PostgreSQL数据库,用于机器学习/人工智能应用。
一款用Rust语言实现的现代列式数据格式,专为机器学习(ML)和大型语言模型(LLMs)设计。只需两行代码即可从Parquet格式转换,实现100倍更快的随机访问、向量索引和数据版本控制。兼容Pandas、DuckDB、Polars、Pyarrow和PyTorch,并即将支持更多集成。
text2vec,将文本转换为向量的工具。它能将文本转化为向量矩阵,支持Word2Vec、RankBM25、Sentence-BERT、CoSENT等多种文本表示和相似度计算模型,方便快捷,无需额外配置。
PyTorch和TorchText情感分析入门教程
AutoRAG:一个开源框架,用于基于检索增强生成 (RAG) 的评估和优化,并具备 AutoML 风格的自动化功能
与你的笔记聊天,并通过AI嵌入查看相关内容的链接。可以使用本地模型或通过Claude、Gemini、ChatGPT和Llama 3等API访问100多个模型。
一款针对文本嵌入模型的极速推理解决方案
【EMNLP 2021论文】SimCSE:一种简单的句子嵌入对比学习方法 https://arxiv.org/abs/2104.08821
一个用于迁移学习的库,它可以重用 TensorFlow 模型的部分组件。
一个用于图像自监督学习的Python库。
Towhee是一个致力于简化和加速神经数据处理流程的框架。