AIBase
首页
AI资讯
AI产品库
模型广场
MCP服务
AI服务
算力市场
AI应用指南
ZH

AI资讯

查看更多

百度 PaddleOCR-VL 模型登顶全球 OCR 榜,连续五日领跑 Huggingface 趋势榜

10月16日,百度飞桨发布视觉语言模型PaddleOCR-VL,以0.9B参数在权威评测OmniDocBench V1.5中获92.56分,超越DeepSeek-OCR等主流模型登顶全球OCR榜单。截至10月21日,Huggingface趋势榜前三均为OCR模型,百度飞桨位列第一。

19.9k 4 小时前
百度 PaddleOCR-VL 模型登顶全球 OCR 榜,连续五日领跑 Huggingface 趋势榜

AI日报:谷歌Gemini 3.0 Pro小范围推送;爱诗科技完成1亿元B+轮融资;百度发布文档解析模型 PaddleOCR-VL

谷歌Gemini 3.0 Pro模型开始小范围推送,强化推理和多模态处理能力,预计本月底正式发布。DeepMind团队持续优化AI性能,助力开发者把握技术趋势。

20.4k 6 天前
AI日报:谷歌Gemini 3.0 Pro小范围推送;爱诗科技完成1亿元B+轮融资;百度发布文档解析模型 PaddleOCR-VL

百度发布全球领先文档解析模型 PaddleOCR-VL,重塑OCR技术格局!

百度开源多模态文档解析模型PaddleOCR-VL,在OmniBenchDoc V1.5评测中以92.6分获全球第一。该模型仅0.9B参数,轻量高效,能精准识别文本、手写汉字、表格、公式及图表,四大核心能力表现卓越。

11.1k 19 小时前
百度发布全球领先文档解析模型 PaddleOCR-VL,重塑OCR技术格局!

模型

查看更多

PaddleOCR VL 0.9B

pcuenq

P

PaddleOCR-VL-0.9B 是一个基于 PaddlePaddle 框架开发的视觉语言模型,专门用于图像文本到文本的转换任务。该模型复刻自 PaddlePaddle 官方版本,支持从图像中提取和识别文本内容。

多模态TransformersTransformers
pcuenq
119
1
AIBase
智启未来,您的人工智能解决方案智库
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2025AIBase
商务合作网站地图