AIBase
首頁
AI資訊
AI產品庫
模型廣場
MCP服务
AI服務
算力市場
AI應用指南
TW

AI資訊

查看更多

百度 PaddleOCR-VL 模型登頂全球 OCR 榜,連續五日領跑 Huggingface 趨勢榜

10月16日,百度飛槳發佈視覺語言模型PaddleOCR-VL,以0.9B參數在權威評測OmniDocBench V1.5中獲92.56分,超越DeepSeek-OCR等主流模型登頂全球OCR榜單。截至10月21日,Huggingface趨勢榜前三均爲OCR模型,百度飛槳位列第一。

22.6k 12 小時前
百度 PaddleOCR-VL 模型登頂全球 OCR 榜,連續五日領跑 Huggingface 趨勢榜

AI日報:谷歌Gemini 3.0 Pro小範圍推送;愛詩科技完成1億元B+輪融資;百度發佈文檔解析模型 PaddleOCR-VL

谷歌Gemini 3.0 Pro模型開始小範圍推送,強化推理和多模態處理能力,預計本月底正式發佈。DeepMind團隊持續優化AI性能,助力開發者把握技術趨勢。

21.1k 2 小時前
AI日報:谷歌Gemini 3.0 Pro小範圍推送;愛詩科技完成1億元B+輪融資;百度發佈文檔解析模型 PaddleOCR-VL

百度發佈全球領先文檔解析模型 PaddleOCR-VL,重塑OCR技術格局!

百度開源多模態文檔解析模型PaddleOCR-VL,在OmniBenchDoc V1.5評測中以92.6分獲全球第一。該模型僅0.9B參數,輕量高效,能精準識別文本、手寫漢字、表格、公式及圖表,四大核心能力表現卓越。

11.9k 6 小時前
百度發佈全球領先文檔解析模型 PaddleOCR-VL,重塑OCR技術格局!

模型

查看更多

PaddleOCR VL 0.9B

pcuenq

P

PaddleOCR-VL-0.9B 是一個基於 PaddlePaddle 框架開發的視覺語言模型,專門用於圖像文本到文本的轉換任務。該模型復刻自 PaddlePaddle 官方版本,支持從圖像中提取和識別文本內容。

多模態TransformersTransformers
pcuenq
119
1
AIBase
智啟未來,您的人工智能解決方案智庫
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2026AIBase
商務合作網站地圖