dots.ocr是一款1.7B參數的輕量化多語言文檔解析模型,在OCR領域表現突出。其特點包括:1)輕量高效,處理單頁PDF僅需數秒;2)支持100種語言,低資源語言處理優勢明顯;3)精準識別文檔佈局元素並保持閱讀順序;4)表格和公式解析能力突出,可輸出LaTeX格式。適用於文檔數字化等場景,但在處理複雜表格、圖片內容時仍有侷限。該模型以輕量化設計打破傳統OCR侷限,展現了文檔解析技術的新高度。
strangervisionhf
這是一個修復後的圖像文本轉文本模型,解決了原模型在最新Transformers版本中推理失敗的問題。該模型專門用於圖像識別和文本生成任務,支持多模態輸入處理。
tcpipuk
dots.ocr是一款強大的多語言文檔解析器,將佈局檢測和內容識別統一在單一視覺語言模型中,基於17億參數實現SOTA性能,支持多語言文檔解析和良好的閱讀順序保持。