SSShooter团队推出AI智能电子书解析工具“电子书转思维导图”,可将EPUB和PDF格式电子书转换为结构化思维导图和文字总结,帮助读者轻松掌握书籍精华,解决电子书格式限制和信息结构不清晰的问题。
dots.ocr是一款1.7B参数的轻量化多语言文档解析模型,在OCR领域表现突出。其特点包括:1)轻量高效,处理单页PDF仅需数秒;2)支持100种语言,低资源语言处理优势明显;3)精准识别文档布局元素并保持阅读顺序;4)表格和公式解析能力突出,可输出LaTeX格式。适用于文档数字化等场景,但在处理复杂表格、图片内容时仍有局限。该模型以轻量化设计打破传统OCR局限,展现了文档解析技术的新高度。
腾讯开源文档理解工具WeKnora,基于大语言模型支持PDF/Word/图片等多格式处理,具备多模态信息提取与整合能力。其模块化架构包含文档解析、向量化处理等核心组件,可实现精准问答和多轮对话,适用于企业知识库、科研分析等场景。项目地址已公开。
腾讯开源多模态文档理解工具WeKnora,支持PDF、Word等格式的智能解析与检索。该工具基于大语言模型,具备文本、表格、图像等复杂文档的结构化处理能力,可生成统一语义视图。其核心优势包括:1)智能交互支持自然语言问答和多轮对话;2)模块化架构便于定制开发;3)适用于企业知识库、科研文献分析等场景。WeKnora的开源将推动文档处理智能化发展,项目已在GitHub发布。
AI发票解析可自动提取发票数据,将PDF和JPEG文档导出至Excel、ERP或通过API。省时、减少错误、简化AP流程。
AnyParser是首个具有准确性和速度的文档解析LLM,可从PDF、PowerPoint和图片中精确提取文本、表格、图表和布局信息。
利用视觉语言模型将PDF解析为Markdown。
文件解析器,专为LLMs解析PDF、Docx、PPTx等文档。
Alibaba
$8
Input tokens/M
-
Output tokens/M
32
Context Length
Tencent
$3
$9
16
Huawei
128
Openai
$17.5
$70
$18
6
Sensetime
$1.5
$4.5
Baidu
Chatglm
echo840
MonkeyOCR是一款基于结构-识别-关系(SRR)三元范式的文档解析模型,能够高效处理PDF和图像文档,提取文本、公式、表格等结构化内容,支持中英文文档解析。
一个基于MCP协议的本地科研论文辅助阅读系统,提供PDF解析、数学公式深度解析、代码生成与可视化功能,支持本地LLM增强和知识管理。
一个基于模型上下文协议(MCP)的服务器,提供美国国家综合癌症网络(NCCN)临床指南的访问服务。该系统通过直接读取指南PDF内容而非使用RAG技术,确保医疗指导的准确性和可靠性。
该项目构建了一个基于RAG的HR聊天机器人,通过MCP服务器作为功能调用中心,实现PDF文档上传、解析、检索及自然语言问答功能。
通过MCP框架增强Claude桌面应用功能的Python工具集
ParseFlow是一个AI驱动的全能文档解析库,支持PDF、Word、Excel、PPT和图片OCR,提供语义搜索和批量处理功能,并包含MCP服务器供AI助手使用。
一个基于Model Context Protocol的arXiv论文检索服务,提供搜索、获取论文详情、按分类检索及PDF全文提取功能。
PDF内容提取服务
一个基于arXiv的论文检索与内容解析工具,支持智能搜索、PDF获取和内容解析功能,特别关注AI领域最新论文。
Zotero-MCP是一个Python服务器,实现了Model Context Protocol(MCP)与Zotero文献管理软件的集成,使AI助手能够访问和查询用户的Zotero文献库。
PDF阅读器MCP服务,为AI代理提供安全、灵活的PDF文件内容提取功能,包括文本、元数据和页数信息。支持本地和远程PDF文件,易于集成到MCP环境中。
GROBID MCP服务器项目
pdffigures2-MCP-Server是一个基于pdffigures2的MCP服务,用于从学术PDF中提取图表、表格、标题和章节标题。
一个通过分析PDF文档辅助用户学习的服务,提供文件转换、内容组织和问题生成功能。
PDF阅读器MCP服务,为AI代理提供安全读取PDF文件内容(文本、元数据、页数)的能力,支持本地和远程PDF文件,易于集成到MCP环境中。
Unpaywall MCP服务器是一个基于模型上下文协议的工具服务器,提供通过DOI获取学术论文元数据、搜索文章标题、获取开放获取全文链接以及下载和提取PDF文本的功能。
Lizeur是一个基于MCP协议的PDF内容提取服务器,利用Mistral AI的OCR技术将PDF转换为易读的markdown文本,支持智能缓存和快速集成。
一个用于解析广告营销行业中Media Kit PDF文件关键内容的项目,通过集成MCP服务实现自动化处理。
一个基于PDF文档分析的智能学习辅助系统,提供文档转换、内容组织和问题生成功能,帮助用户高效学习。
iReader MCP是一个提供互联网内容读取和提取工具的MCP服务器,支持网页、YouTube视频、推特线程和PDF文件的文本提取。