百度AI团队推出PaddleOCR 3.1版 关键能力支持MCP
7月7日,百度AI团队宣布PaddleOCR3.1版本正式上线,在多语种识别、复杂文档翻译及大模型连接能力上实现三大升级。新版本支持37种语言的文本识别,平均精度提升超30%,并推出文档翻译产线与MCP服务器功能,助力开发者高效构建AI应用。
针对全球化场景下的多语言需求,PaddleOCR3.1新增PP-OCRv5多语种模型,覆盖法语、西班牙语、俄语等37种语言。通过融合文心4.5多模态大模型的视觉与文本理解能力,模型可自动完成高置信度文本检测与数据标注,解决多语种数据稀缺痛点。实测数据显示,新模型在拉丁语系及东斯