最好的PaddleOCR AI工具模型_精選PaddleOCR資訊 - AIBase

AI資訊

百度文心發佈PaddleOCR-VL-1.6:準確率破96.33%刷新文檔解析SOTA

百度發佈文心大模型衍生模型PaddleOCR-VL-1.6，在OmniDocBench v1.6評測中以96.33%準確率超越Gemini-3-Pro、GPT-5.2等主流模型，刷新SOTA，綜合性能全球第一。該模型標誌着多模態大模型在複雜文檔理解與真實場景解析上的重大突破，支持超100種語言識別，用戶覆蓋廣泛。

17.9k 3 小時前

百度文心發佈PaddleOCR-VL-1.6:準確率破96.33%刷新文檔解析SOTA

PaddleOCR 登頂 GitHub Star 全球第一：中國開源力量領跑 OCR 領域

百度PaddleOCR登頂GitHub全球OCR開源項目榜首，超越Tesseract等老牌項目，標誌着中國深度學習框架在垂直技術領域具備國際領先影響力。其成功源於超輕量模型與全棧技術能力，提供了從算法到部署的完整解決方案。

PaddleOCR 登頂 GitHub Star 全球第一：中國開源力量領跑 OCR 領域

百度 PaddleOCR-VL 模型登頂全球 OCR 榜，連續五日領跑 Huggingface 趨勢榜

10月16日，百度飛槳發佈視覺語言模型PaddleOCR-VL，以0.9B參數在權威評測OmniDocBench V1.5中獲92.56分，超越DeepSeek-OCR等主流模型登頂全球OCR榜單。截至10月21日，Huggingface趨勢榜前三均爲OCR模型，百度飛槳位列第一。

百度 PaddleOCR-VL 模型登頂全球 OCR 榜，連續五日領跑 Huggingface 趨勢榜

AI日報：谷歌Gemini 3.0 Pro小範圍推送；愛詩科技完成1億元B+輪融資；百度發佈文檔解析模型 PaddleOCR-VL

谷歌Gemini 3.0 Pro模型開始小範圍推送，強化推理和多模態處理能力，預計本月底正式發佈。DeepMind團隊持續優化AI性能，助力開發者把握技術趨勢。

AI日報：谷歌Gemini 3.0 Pro小範圍推送；愛詩科技完成1億元B+輪融資；百度發佈文檔解析模型 PaddleOCR-VL

AI產品

STranslate

STranslate

即用即走的翻譯、OCR工具

OnnxOCR

OnnxOCR

輕量級OCR模型，推理速度快

AI圖像檢測識別

模型

PaddleOCR VL 0.9B

pcuenq

PaddleOCR-VL-0.9B 是一個基於 PaddlePaddle 框架開發的視覺語言模型，專門用於圖像文本到文本的轉換任務。該模型復刻自 PaddlePaddle 官方版本，支持從圖像中提取和識別文本內容。

Transformers

En_PP OCRv5_mobile_rec

PaddlePaddle

PaddleOCR團隊開發的最新一代英文文本行識別模型，專為高效、準確的英文OCR識別而設計，在移動端設備上具有優異的性能表現。

計算機視覺英語

Devanagari_PP OCRv3_mobile_rec

PaddlePaddle

PaddleOCR團隊開發的PP-OCRv3_rec系列中的天城文專用文本行識別模型，支持天城文識別，平均準確率96.44%。

計算機視覺多語言

PP OCRv4_server_rec

PaddlePaddle

PP-OCRv4_server_rec 是 PaddleOCR 團隊開發的 PP-OCRv4_rec 系列中的一個文本行識別模型，支持一般中文和英文場景下的文本行識別，主要側重於中文。

計算機視覺多語言

En_PP OCRv4_mobile_rec

PaddlePaddle

PaddleOCR團隊開發的超輕量級英文文本行識別模型，支持英文和數字字符識別

計算機視覺多語言

PP OCRv3_mobile_rec

PaddlePaddle

PP-OCRv3_mobile_rec 是 PaddleOCR 團隊開發的輕量級文本行識別模型，採用 SVTR 算法，支持中英文識別，尤其專注於中文場景。

計算機視覺多語言

Japan_PP OCRv3_mobile_rec

PaddlePaddle

由PaddleOCR團隊開發的超輕量級日語文本行識別模型，支持日語和數字字符識別。

計算機視覺多語言

PP FormulaNet_plus M

PaddlePaddle

PP-FormulaNet_plus-M 是由 PaddleOCR 團隊開發的增強版公式識別模型，支持中文公式識別，並提升了對複雜公式的處理能力。

計算機視覺多語言

Cyrillic_PP OCRv3_mobile_rec

PaddlePaddle

由PaddleOCR團隊開發的超輕量級西里爾文文本行識別模型，基於PP-OCRv3_mobile_rec訓練，專門針對西里爾文優化

計算機視覺多語言

PP OCRv4_mobile_rec

PaddlePaddle

PP-OCRv4_mobile_rec 是 PaddleOCR 團隊開發的輕量級文本行識別模型，專注於中文和英文場景下的高效文本識別。

計算機視覺多語言

PP FormulaNet_plus L

PaddlePaddle

PP-FormulaNet_plus-L 是 PaddleOCR 團隊開發的增強版公式識別模型，支持中文公式識別，最大標記數提升至2560，適用於複雜公式場景。

計算機視覺多語言

Latin_PP OCRv3_mobile_rec

PaddlePaddle

PaddleOCR團隊開發的超輕量級拉丁語文本行識別模型，支持拉丁語和數字字符識別。

計算機視覺多語言

PP OCRv4_mobile_det

PaddlePaddle

PP-OCRv4_mobile_det 是由 PaddleOCR 團隊開發的針對移動設備優化的高效文本檢測模型，適合邊緣設備部署。

計算機視覺多語言

Arabic_PP OCRv3_mobile_rec

PaddlePaddle

PaddleOCR團隊開發的超輕量級阿拉伯字母識別模型，支持阿拉伯字母和數字字符識別。

計算機視覺多語言

En_PP OCRv3_mobile_rec

PaddlePaddle

PaddleOCR團隊開發的超輕量級英文文本行識別模型，支持英文和數字字符識別

計算機視覺多語言

PP OCRv4_server_det

PaddlePaddle

PP-OCRv4_server_det 是 PaddleOCR 團隊開發的文本檢測模型，適用於高性能服務器部署，具有高準確率。

計算機視覺多語言

PP OCRv5_mobile_rec

PaddlePaddle

PP-OCRv5_mobile_rec 是 PaddleOCR 團隊開發的最新一代文本行識別模型，支持簡體中文、繁體中文、英文和日文四種語言的識別，適用於多種複雜文本場景。

計算機視覺多語言

PP OCRv5_server_rec

PaddlePaddle

PP-OCRv5_server_rec 是 PaddleOCR 團隊開發的最新一代文本行識別模型，支持多語言和複雜文本場景的識別。

計算機視覺多語言

PP OCRv5_mobile_det

PaddlePaddle

PP-OCRv5_mobile_det是PaddleOCR團隊研發的最新一代輕量級文本檢測模型，支持多語言、多場景下的高效文本檢測。

計算機視覺多語言

PP OCRv5_server_det

PaddlePaddle

PP-OCRv5_server_det 是 PaddleOCR 團隊研發的最新一代文本檢測模型，專為高性能應用場景設計，支持檢測多種場景下的文本，包括手寫、豎排、旋轉和彎曲文本，可識別多種語言。

計算機視覺多語言

AIBase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AI Marketing LLM Leaderboard AI Ranking

© 2026AIBase

商務合作網站地圖