dots.ocr是一款1.7B参数的轻量化多语言文档解析模型,在OCR领域表现突出。其特点包括:1)轻量高效,处理单页PDF仅需数秒;2)支持100种语言,低资源语言处理优势明显;3)精准识别文档布局元素并保持阅读顺序;4)表格和公式解析能力突出,可输出LaTeX格式。适用于文档数字化等场景,但在处理复杂表格、图片内容时仍有局限。该模型以轻量化设计打破传统OCR局限,展现了文档解析技术的新高度。
strangervisionhf
这是一个修复后的图像文本转文本模型,解决了原模型在最新Transformers版本中推理失败的问题。该模型专门用于图像识别和文本生成任务,支持多模态输入处理。
tcpipuk
dots.ocr是一款强大的多语言文档解析器,将布局检测和内容识别统一在单一视觉语言模型中,基于17亿参数实现SOTA性能,支持多语言文档解析和良好的阅读顺序保持。