百度發佈文心大模型衍生模型PaddleOCR-VL-1.6,在OmniDocBench v1.6評測中以96.33%準確率超越Gemini-3-Pro、GPT-5.2等主流模型,刷新SOTA,綜合性能全球第一。該模型標誌着多模態大模型在複雜文檔理解與真實場景解析上的重大突破,支持超100種語言識別,用戶覆蓋廣泛。
智譜開源專業OCR模型GLM-OCR,僅0.9B參數實現跨級性能突破。在OmniDocBench V1.5榜單中以94.6分奪冠,逼近通用大模型Gemini-3-Pro,有效解決複雜文檔解析痛點。
10月16日,百度飛槳發佈視覺語言模型PaddleOCR-VL,以0.9B參數在權威評測OmniDocBench V1.5中獲92.56分,超越DeepSeek-OCR等主流模型登頂全球OCR榜單。截至10月21日,Huggingface趨勢榜前三均爲OCR模型,百度飛槳位列第一。