百度PaddleOCR登頂GitHub全球OCR開源項目榜首,超越Tesseract等老牌項目,標誌着中國深度學習框架在垂直技術領域具備國際領先影響力。其成功源於超輕量模型與全棧技術能力,提供了從算法到部署的完整解決方案。
10月16日,百度飛槳發佈視覺語言模型PaddleOCR-VL,以0.9B參數在權威評測OmniDocBench V1.5中獲92.56分,超越DeepSeek-OCR等主流模型登頂全球OCR榜單。截至10月21日,Huggingface趨勢榜前三均爲OCR模型,百度飛槳位列第一。
谷歌Gemini 3.0 Pro模型開始小範圍推送,強化推理和多模態處理能力,預計本月底正式發佈。DeepMind團隊持續優化AI性能,助力開發者把握技術趨勢。
百度開源多模態文檔解析模型PaddleOCR-VL,在OmniBenchDoc V1.5評測中以92.6分獲全球第一。該模型僅0.9B參數,輕量高效,能精準識別文本、手寫漢字、表格、公式及圖表,四大核心能力表現卓越。
即用即走的翻譯、OCR工具
輕量級OCR模型,推理速度快
pcuenq
PaddleOCR-VL-0.9B 是一個基於 PaddlePaddle 框架開發的視覺語言模型,專門用於圖像文本到文本的轉換任務。該模型復刻自 PaddlePaddle 官方版本,支持從圖像中提取和識別文本內容。
PaddlePaddle
PaddleOCR團隊開發的最新一代英文文本行識別模型,專為高效、準確的英文OCR識別而設計,在移動端設備上具有優異的性能表現。
PaddleOCR團隊開發的PP-OCRv3_rec系列中的天城文專用文本行識別模型,支持天城文識別,平均準確率96.44%。
PP-OCRv4_server_rec 是 PaddleOCR 團隊開發的 PP-OCRv4_rec 系列中的一個文本行識別模型,支持一般中文和英文場景下的文本行識別,主要側重於中文。
PaddleOCR團隊開發的超輕量級英文文本行識別模型,支持英文和數字字符識別
PP-OCRv3_mobile_rec 是 PaddleOCR 團隊開發的輕量級文本行識別模型,採用 SVTR 算法,支持中英文識別,尤其專注於中文場景。
由PaddleOCR團隊開發的超輕量級日語文本行識別模型,支持日語和數字字符識別。
PP-FormulaNet_plus-M 是由 PaddleOCR 團隊開發的增強版公式識別模型,支持中文公式識別,並提升了對複雜公式的處理能力。
由PaddleOCR團隊開發的超輕量級西里爾文文本行識別模型,基於PP-OCRv3_mobile_rec訓練,專門針對西里爾文優化
PP-OCRv4_mobile_rec 是 PaddleOCR 團隊開發的輕量級文本行識別模型,專注於中文和英文場景下的高效文本識別。
PP-FormulaNet_plus-L 是 PaddleOCR 團隊開發的增強版公式識別模型,支持中文公式識別,最大標記數提升至2560,適用於複雜公式場景。
PaddleOCR團隊開發的超輕量級拉丁語文本行識別模型,支持拉丁語和數字字符識別。
PP-OCRv4_mobile_det 是由 PaddleOCR 團隊開發的針對移動設備優化的高效文本檢測模型,適合邊緣設備部署。
PaddleOCR團隊開發的超輕量級阿拉伯字母識別模型,支持阿拉伯字母和數字字符識別。
PP-OCRv4_server_det 是 PaddleOCR 團隊開發的文本檢測模型,適用於高性能服務器部署,具有高準確率。
PP-OCRv5_mobile_rec 是 PaddleOCR 團隊開發的最新一代文本行識別模型,支持簡體中文、繁體中文、英文和日文四種語言的識別,適用於多種複雜文本場景。
PP-OCRv5_server_rec 是 PaddleOCR 團隊開發的最新一代文本行識別模型,支持多語言和複雜文本場景的識別。
PP-OCRv5_mobile_det是PaddleOCR團隊研發的最新一代輕量級文本檢測模型,支持多語言、多場景下的高效文本檢測。
PP-OCRv5_server_det 是 PaddleOCR 團隊研發的最新一代文本檢測模型,專為高性能應用場景設計,支持檢測多種場景下的文本,包括手寫、豎排、旋轉和彎曲文本,可識別多種語言。