Best OCR模型 AI Tools & Models - Premium OCR模型 News

AI News

AI日报：混元发布HyOCR-1.5；PixVerse完成4.39亿美元融资；商汤开源 SenseNova-Vision-7B-MoT

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://app.aibase.com/zh1、腾讯混元发布HyOCR-1.5：仅1B参数推理提速6.37倍HyOCR-1.5作为轻量化端到端OCR模型，通过技术创新实现了性能与效率的飞跃，同时开放全栈源代码，降低了开发门槛，推动了OCR技术的普及和应用。AI原生App的用户黏性显著提升，表明其正在快速改写竞争格局。

17.5k 3 hours ago

AI日报：混元发布HyOCR-1.5；PixVerse完成4.39亿美元融资；商汤开源 SenseNova-Vision-7B-MoT

腾讯混元发布 HyOCR-1.5：仅 1B 参数推理提速 6.37 倍

轻量级端到端OCR模型HyOCR-1.5发布，在保持轻量化同时大幅提升性能与效率。作为首个全栈开源OCR模型，它全面开放权重、训练配方、数据构造方法及推理加速框架，显著降低开发门槛，让开发者可轻松复现、微调，并在消费级显卡或笔记本上部署。

18.6k 2 hours ago

腾讯混元发布 HyOCR-1.5：仅 1B 参数推理提速 6.37 倍

视觉模型新突破：商汤开源 SenseNova-Vision-7B-MoT

商汤科技开源多任务视觉模型SenseNova-Vision-7B-MoT，集成目标检测、OCR、深度估计、法线估计、图像分割与多视图处理等核心视觉任务于7B参数单一架构，为视觉理解及GUI智能体开发提供高效基座。

13.1k 18 minutes ago

视觉模型新突破：商汤开源 SenseNova-Vision-7B-MoT

百度开源3B模型Unlimited OCR:5天Star破万，刷新长文档解析纪录

百度开源3B参数端到端OCR模型Unlimited OCR，专攻书籍论文等长文档。项目上线5天GitHub Star破万，登顶四项趋势榜。技术上，推理激活约570M参数，创新引入Reference Sliding Window Attention机制，突破逐页拼接限制，支持数十页一次性连续解析，大幅提升长文档处理效率。

14.6k 3 hours ago

百度开源3B模型Unlimited OCR:5天Star破万，刷新长文档解析纪录

AI Products

Aya Vision 32B

Aya Vision 32B

Aya Vision 32B 是一个支持多语言的视觉语言模型，适用于OCR、图像描述、视觉推理等多种用途。

Aya Vision 8B

Aya Vision 8B

8亿参数的多语言视觉语言模型，支持OCR、图像描述、视觉推理等功能

Ollama OCR for web

Ollama OCR for web

一个强大的OCR包，使用最先进的视觉语言模型提取图像中的文本。

mPLUG-DocOwl 1.5

mPLUG-DocOwl 1.5

OCR-free 文档理解的统一结构学习模型

Models

GPT-4.1 mini

Openai

GPT-4.1 mini

$2.8

Input tokens/M

$11.2

Output tokens/M

1k

Context Length

Gemini 2.0 Flash-Lite

Google

Gemini 2.0 Flash-Lite

$0.49

Input tokens/M

$2.1

Output tokens/M

1k

Context Length

Grok 4 Fast

Xai

Grok 4 Fast

$1.4

Input tokens/M

$3.5

Output tokens/M

2k

Context Length

o3-mini

Openai

o3-mini

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

GPT-5 Codex

Openai

GPT-5 Codex

-

Input tokens/M

-

Output tokens/M

-

Context Length

Claude 3 Opus

Anthropic

Claude 3 Opus

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

Gemini 2.0 Flash

$0.7

Input tokens/M

$2.8

Output tokens/M

1k

Context Length

Claude Haiku 4.5

Anthropic

Claude Haiku 4.5

$7

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

Gemini 2.5 Flash

$2.1

Input tokens/M

$17.5

Output tokens/M

1k

Context Length

Claude Sonnet 4.5

Anthropic

Claude Sonnet 4.5

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

Claude 3 Sonnet

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

Gemini 2.5 Flash-Lite

$0.7

Input tokens/M

$2.8

Output tokens/M

1k

Context Length

qwen-image-plus

Alibaba

qwen-image-plus

-

Input tokens/M

-

Output tokens/M

-

Context Length

qwen3-coder-plus

Alibaba

qwen3-coder-plus

$4

Input tokens/M

$16

Output tokens/M

1k

Context Length

qwen3-vl-plus

Alibaba

qwen3-vl-plus

$1

Input tokens/M

$10

Output tokens/M

256

Context Length

Qianfan-Lightning

Baidu

Qianfan-Lightning

-

Input tokens/M

-

Output tokens/M

128

Context Length

wan2.5-i2i-preview

Alibaba

wan2.5-i2i-preview

-

Input tokens/M

-

Output tokens/M

-

Context Length

qwen3-max

Alibaba

qwen3-max

$6

Input tokens/M

$24

Output tokens/M

256

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

qwen3-vl-235b-a22b-thinking

$2

Input tokens/M

$20

Output tokens/M

-

Context Length

qwen-image-edit

Alibaba

qwen-image-edit

-

Input tokens/M

-

Output tokens/M

-

Context Length

MCP

nutrient-dws-mcp-server

Nutrient Dws Mcp Server

Nutrient DWS MCP Server是一个与Nutrient文档Web服务处理器API集成的模型上下文协议服务器，为AI助手提供强大的PDF处理功能，包括数字签名、文档生成、编辑、OCR、水印、涂黑等操作。

openai-ocr-mcp

Openai Ocr Mcp

基于OpenAI视觉模型的OCR服务，集成Cursor IDE实现图片文字自动提取与保存

file-ai-mcp

File Ai Mcp

fileAI MCP服务器提供端到端的文件处理解决方案，包括OCR、文档分类和结构化数据提取，支持AI模型集成和异步处理。

人工智能聊天机器人

odoo-mcp-server-unofficial

Odoo Mcp Server Unofficial

Odoo MCP服务器提供对Odoo 18.0的高安全JSON-RPC访问和OCR文档解析的Extract API接口，支持模型查询、记录操作和文档提取功能。

AIBase

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AI Marketing LLM Leaderboard AI Ranking

© 2026AIBase

Business Cooperation Site Map