发现与 Document Processing Pipeline 相关的最受欢迎的开源项目和工具,了解最新的开发趋势和创新。
Pytorch、TensorFlow和JAX框架下最先进的机器学习转换器
适用于GPU云端和本地环境的ComfyUI Docker镜像。包含AI-Dock基础镜像,用于身份验证和提升用户体验。
《动手学深度学习》是一本面向中文读者的实用型深度学习教材,提供可运行的代码和丰富的讨论内容。它已被全球70多个国家、500多所大学采用,作为深度学习课程的教材。
For developers, who are building real-time data-driven applications, Redis is the preferred, fastest, and most feature-rich cache, data structure server, and document and vector query engine.
学习如何设计、开发、部署和迭代生产级别的机器学习应用。
降低大型AI模型的成本,提升其速度和易用性
DeepSpeed是一个深度学习优化库,它使分布式训练和推理变得轻松、高效且有效。
把文字切分成词语,并标注每个词的词性(例如名词、动词);识别出人名、地名、机构名等命名实体;分析句子中词语之间的语法关系;分析句子的结构成分;分析句子中词语之间的语义关系;标注句子中每个成分的语义角色(例如施事者、受事者);解决代词指代不明确的问题;转换文本的写作风格;计算文本间的语义相似度;发现新的词语;提取关键词和短语;自动生成文本摘要;对文本进行分类和聚类;进行中文简繁体转换;以及其他自然语言处理技术。
Python语言的工业级自然语言处理(NLP)
适用于直播和流媒体的跨平台、可定制机器学习解决方案
用于流处理、实时分析、大型语言模型(LLM)管道和检索增强生成(RAG)的Python ETL框架
公司分享其在生产环境中数据科学和机器学习工作的论文和技术博客。
开箱即用的OCR,支持80多种语言和所有流行的文字系统,包括拉丁文、中文、阿拉伯文、天城文、西里尔文等等。
Deezer 声源分离库,包含预训练模型。
一本互动式深度学习教材,包含多框架代码、数学公式和深入讨论。已被全球70多个国家的500多所大学采用,包括斯坦福大学、麻省理工学院、哈佛大学和剑桥大学。
AI 驱动的 PDF 学术论文翻译,完美保留原有排版格式。支持 Google、DeepL、Ollama、OpenAI 等多种翻译引擎,提供命令行界面 (CLI)、图形用户界面 (GUI)、Docker 镜像和 Zotero 插件。
这是一个用于追踪自然语言处理 (NLP) 领域进展的资源库,包含数据集以及最常见 NLP 任务的当前最新技术水平。
使用云原生技术栈构建多模态AI应用
跨任务、跨语言、跨模态的大规模自监督预训练
基于人工智能的开源嵌入式数据库