最高のOCRモデル AIツールモデル_厳選OCRモデル情報 - AIBase

AIニュース

もっと見る

Mistral AI、新版ドキュメント認識技術「Mistral OCR 3」モデルを公開

Mistral AIが新たに発表したOCR3は、表やスキャン文書、複雑な表、手書き文字の認識に優れ、前世代比74%性能向上。多様な文書からテキストと画像を高精度で抽出し、処理効率と精度を大幅に向上させます。....

16.1k 14 時間前

Mistral AI、新版ドキュメント認識技術「Mistral OCR 3」モデルを公開

AIニュース：ドゥーパオ入力法が正式リリース；混元オープンソースのHunyuanOCRモデル；Claude Opus4.5のリリース

腾讯混元が10億パラメータのOCRモデルHunyuanOCRをオープンソース化。マルチモーダルアーキテクチャを基に、複数タスクで最先端の性能を実現し、多様なシーンでの文字認識をサポート。....

24.1k 11 時間前

AIニュース：ドゥーパオ入力法が正式リリース；混元オープンソースのHunyuanOCRモデル；Claude Opus4.5のリリース

テンセントがHunyuanOCRオープンソースモデルをリリース。パラメーターはわずか1Bで、複数のSOTA性能を達成

腾讯が1BパラメータのオープンソースOCRモデル「HunyuanOCR」を発表。混元マルチモーダルアーキテクチャを基に、SOTA性能を達成。エンドツーエンド設計で、高解像度ビデオエンコーダー・適応型視覚適応・軽量言語モデルの3要素を統合。....

13.6k 9 時間前

テンセントがHunyuanOCRオープンソースモデルをリリース。パラメーターはわずか1Bで、複数のSOTA性能を達成

騰訊混元がオープンソースのHunyuanOCRモデルをリリース：10億パラメータで複数のSOTAを達成し、多様なシナリオでOCRアプリケーションを強化

騰訊混元が10億パラメータを持つオープンソースのOCRモデルHunyuanOCRをリリースしました。エンドツーエンド設計で、動画エンコーダー、ビジュアルアダプター、軽量言語モデルを統合しており、複数のランキングでSOTAの成績を収めています。サイズが小さく、導入が簡単なことが主な優位点であり、効率的なOCRソリューションを提供します。

騰訊混元がオープンソースのHunyuanOCRモデルをリリース：10億パラメータで複数のSOTAを達成し、多様なシナリオでOCRアプリケーションを強化

AI製品

もっと見る

Aya Vision 32B

Aya Vision 32B

Aya Vision 32Bは、OCR、画像記述、視覚推論など、多様な用途に適した多言語対応のビジュアル言語モデルです。

Aya Vision 8B

Aya Vision 8B

8億パラメーターの多言語視覚言語モデルで、OCR、画像キャプション、視覚推論などの機能をサポートしています。

Ollama OCR for web

Ollama OCR for web

最先端ビジョン言語モデルを用いて画像内のテキストを抽出する、強力なOCRパッケージです。

mPLUG-DocOwl 1.5

mPLUG-DocOwl 1.5

OCR不要求のドキュメント理解のための統一構造学習モデル

研究ツール

モデル

もっと見る

Gemini 2.0 Flash-Lite

Google

Gemini 2.0 Flash-Lite

$0.49

入力トークン/百万

$2.1

出力トークン/百万

1k

コンテキスト長

GPT-4.1 mini

Openai

GPT-4.1 mini

$2.8

入力トークン/百万

$11.2

出力トークン/百万

1k

コンテキスト長

Grok 4 Fast

Xai

Grok 4 Fast

$1.4

入力トークン/百万

$3.5

出力トークン/百万

2k

コンテキスト長

o3 - mini

Openai

o3 - mini

$7.7

入力トークン/百万

$30.8

出力トークン/百万

200

コンテキスト長

GPT-5 Codex

Openai

GPT-5 Codex

-

入力トークン/百万

-

出力トークン/百万

-

コンテキスト長

Claude 3 Opus

Anthropic

Claude 3 Opus

$105

入力トークン/百万

$525

出力トークン/百万

200

コンテキスト長

Gemini 2.0 Flash

Google

Gemini 2.0 Flash

$0.7

入力トークン/百万

$2.8

出力トークン/百万

1k

コンテキスト長

Claude Haiku 4.5

Anthropic

Claude Haiku 4.5

$7

入力トークン/百万

$35

出力トークン/百万

200

コンテキスト長

Gemini 2.5 Flash

Google

Gemini 2.5 Flash

$2.1

入力トークン/百万

$17.5

出力トークン/百万

1k

コンテキスト長

Claude Sonnet 4.5

Anthropic

Claude Sonnet 4.5

$21

入力トークン/百万

$105

出力トークン/百万

200

コンテキスト長

Claude 3 Sonnet

Anthropic

Claude 3 Sonnet

$21

入力トークン/百万

$105

出力トークン/百万

200

コンテキスト長

Gemini 2.5 Flash-Lite

Google

Gemini 2.5 Flash-Lite

$0.7

入力トークン/百万

$2.8

出力トークン/百万

1k

コンテキスト長

qwen3-vl-plus

Alibaba

qwen3-vl-plus

$1

入力トークン/百万

$10

出力トークン/百万

256

コンテキスト長

qwen-image-plus

Alibaba

qwen-image-plus

-

入力トークン/百万

-

出力トークン/百万

-

コンテキスト長

Qianfan-Lightning

Baidu

Qianfan-Lightning

-

入力トークン/百万

-

出力トークン/百万

128

コンテキスト長

qwen3-max

Alibaba

qwen3-max

$6

入力トークン/百万

$24

出力トークン/百万

256

コンテキスト長

wan2.5-i2i-preview

Alibaba

wan2.5-i2i-preview

-

入力トークン/百万

-

出力トークン/百万

-

コンテキスト長

qwen3-coder-plus

Alibaba

qwen3-coder-plus

$4

入力トークン/百万

$16

出力トークン/百万

1k

コンテキスト長

qwen3-vl-235b-a22b-thinking

Alibaba

qwen3-vl-235b-a22b-thinking

$2

入力トークン/百万

$20

出力トークン/百万

-

コンテキスト長

qwen-image-edit

Alibaba

qwen-image-edit

-

入力トークン/百万

-

出力トークン/百万

-

コンテキスト長

MCP

もっと見る

nutrient-dws-mcp-server

Nutrient Dws Mcp Server

ニュートリエントDWS MCPサーバーは、ニュートリエントドキュメントWebサービスプロセッサAPIと統合されたモデルコンテキストプロトコルサーバーで、AIアシスタントに強力なPDF処理機能を提供します。デジタル署名、ドキュメント生成、編集、OCR、透かし、塗りつぶしなどの操作が可能です。

2.5ポイント

odoo-mcp-server-unofficial

Odoo Mcp Server Unofficial

Odoo MCPサーバーは、Odoo 18.0への高度なセキュリティのJSON - RPCアクセスとOCRドキュメント解析のExtract APIインターフェイスを提供し、モデル検索、レコード操作、ドキュメント抽出機能をサポートします。

2.0ポイント

openai-ocr-mcp

Openai Ocr Mcp

OpenAIのビジュアルモデルに基づくOCRサービスで、Cursor IDEと統合して画像の文字を自動抽出し保存します。

2.0ポイント

file-ai-mcp

File Ai Mcp

fileAI MCPサーバーは、OCR、文書分類、構造化データ抽出を含むエンドツーエンドのファイル処理ソリューションを提供し、AIモデルの統合と非同期処理をサポートします。

人工知能チャットボット

2.0ポイント

Karakeep MCP server

Karakeep MCP server

Karakeep（旧称Hoarder）は、自ホスト型の万能ブックマークアプリで、データ収集家向けに設計されています。AI技術を組み合わせて、リンク情報の自動取得、スマートタグ、OCRなどの機能を備え、多プラットフォームのプラグインとモバイルアプリをサポートしています。

評価はありません

AIBase

未来を力づける、あなたの人工知能ソリューションシンクタンク

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

© 2026AIBase

ビジネス協力サイトマップ