最好的表格识别 AI工具模型_精选表格识别资讯

AI资讯

IBM发布Granite 4.0 3B Vision：企业级文档数据提取的新利器

IBM发布Granite 4.0 3B Vision视觉语言模型，拥有30亿参数，专为企业级复杂文档数据提取优化。该模型针对金融、法律、医疗等行业非结构化数据处理难题，在复杂表格、扫描件及多模态布局文档中表现突出，通过结合视觉理解与语言生成，精准识别并提取关键信息。

16.9k 昨天

IBM发布Granite 4.0 3B Vision：企业级文档数据提取的新利器

Mistral AI 发布新版文档识别技术 Mistral OCR 3 模型

Mistral AI发布新一代文档识别技术Mistral OCR3，在表格、扫描文档、复杂表格及手写识别方面表现突出，整体性能较上一代提升74%。该技术旨在高效准确提取各类文档中的文本和嵌入式图像，支持多格式处理，显著提升文档处理效率与精度。

20.2k 昨天

NotebookLM升级支持图像导入板书秒变可检索知识库

谷歌推出NotebookLM图像识别功能，支持上传板书、教材或表格图片，自动完成文字识别与语义分析，用户可直接用自然语言检索图片内容。该功能全平台免费，即将增加本地处理选项保护隐私。系统采用多模态技术，能区分手写与印刷体、解析表格结构，并与现有笔记智能关联。

29.8k 18 小时前

百度发布全球领先文档解析模型 PaddleOCR-VL，重塑OCR技术格局！

百度开源多模态文档解析模型PaddleOCR-VL，在OmniBenchDoc V1.5评测中以92.6分获全球第一。该模型仅0.9B参数，轻量高效，能精准识别文本、手写汉字、表格、公式及图表，四大核心能力表现卓越。

17.7k 12 小时前

AI产品

RapidLayoutRecover

文档图像版面还原工具

AI图像编辑

12.2k

TF-ID

学术文献中表格和图表的识别工具

AI图像检测识别

9.6k

模型

Claude 3 Sonnet

Anthropic

$21

输入tokens/百万

$105

输出tokens/百万

200

上下文长度

qwen3-vl-plus

Alibaba

输入tokens/百万

$10

输出tokens/百万

256

上下文长度

qwen3-livetranslate-flaltimeash-re-2025-09-22

Alibaba

输入tokens/百万

$240

输出tokens/百万

上下文长度

qwen3-omni-30b-a3b-captioner

Alibaba

$15.8

输入tokens/百万

$12.7

输出tokens/百万

上下文长度

Doubao - Seedream - 4.0

Bytedance

输入tokens/百万

输出tokens/百万

上下文长度

Doubao - Seedream - 3.0 - t2i

Bytedance

输入tokens/百万

输出tokens/百万

上下文长度

Doubao-SeedEdit-3.0-i2i

Bytedance

输入tokens/百万

输出tokens/百万

上下文长度

qwen-vl-plus

Alibaba

$0.8

输入tokens/百万

输出tokens/百万

128

上下文长度

qwen3-asr-flash

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

Qianfan-VL-8B

Baidu

输入tokens/百万

输出tokens/百万

上下文长度

Qianfan-VL-70B

Baidu

输入tokens/百万

输出tokens/百万

上下文长度

Qwen3-0.6B

Alibaba

$0.3

输入tokens/百万

输出tokens/百万

上下文长度

Hunyuan-T1-Vision

Tencent

输入tokens/百万

输出tokens/百万

上下文长度

QianfanHuijin-8B

Baidu

输入tokens/百万

输出tokens/百万

上下文长度

QianfanHuijin-Reason-8B

Baidu

输入tokens/百万

输出tokens/百万

上下文长度

Qianfan-QI-VL

Baidu

输入tokens/百万

输出tokens/百万

上下文长度

Doubao-1.5-vision-lite

Bytedance

$1.5

输入tokens/百万

$4.5

输出tokens/百万

128

上下文长度

Doubao-1.5-vision-pro-32k

Bytedance

输入tokens/百万

输出tokens/百万

上下文长度

Pangu-AgentExpert-N1-0.0.2

Huawei

输入tokens/百万

输出tokens/百万

上下文长度

Qianfan-Llama-VL-8B

Baidu

输入tokens/百万

输出tokens/百万

上下文长度

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AI Marketing LLM Leaderboard AI Ranking

商务合作网站地图

AI资讯

IBM发布Granite 4.0 3B Vision：企业级文档数据提取的新利器

Mistral AI 发布新版文档识别技术 Mistral OCR 3 模型

NotebookLM升级支持图像导入 板书秒变可检索知识库

百度发布全球领先文档解析模型 PaddleOCR-VL，重塑OCR技术格局！

AI产品

RapidLayoutRecover

TF-ID

模型

Claude 3 Sonnet

qwen3-vl-plus

qwen3-livetranslate-flaltimeash-re-2025-09-22

qwen3-omni-30b-a3b-captioner

Doubao - Seedream - 4.0

Doubao - Seedream - 3.0 - t2i

Doubao-SeedEdit-3.0-i2i

qwen-vl-plus

qwen3-asr-flash

Qianfan-VL-8B

Qianfan-VL-70B

Qwen3-0.6B

Hunyuan-T1-Vision

QianfanHuijin-8B

QianfanHuijin-Reason-8B

Qianfan-QI-VL

Doubao-1.5-vision-lite

Doubao-1.5-vision-pro-32k

Pangu-AgentExpert-N1-0.0.2

Qianfan-Llama-VL-8B

LightOnOCR 1B 1025 GGUF

Chandra

MonkeyOCR Pro 3B

RT DETR L_wireless_table_cell_det

RT DETR L_wired_table_cell_det

SLANet_plus

EraX VL 7B V2.0 Preview

MinerU

StructTable InternVL2 1B

Tablecell Htr

Paligemma 3b Mix 448 Ft TableDetection

Tabletransstructrecog_finetuned_pubt1m_lstabletransstrucrecogv1_session6

ModelStructure_TT_V3

Pix2text Table Rec

Table Transformer Structure Recognition V1.1 All

Table Transformer Structure Recognition V1.1 Fin

Table Transformer Structure Recognition V1.1 Pub

Table Transformer Detection Custom Ale

Tatr_tab_struct_v2

Table Detection And Extraction

NotebookLM升级支持图像导入板书秒变可检索知识库