最高のOCR AIツールモデル_厳選OCR情報 - AIBase

AIニュース

もっと見る

フランスのAIスタートアップであるMistral AIがOCR4モデルを発表：170の言語をカバーし、インタラクション体験がより人間らしい

フランスのMistral AIが、10語族170言語対応のOCR4文書認識モデルを発表。OmniDocBenchで93.07点を獲得し、出力は正確で自然。GPT‑5.5ProやGemini 3.1Proより優れたユーザー体験を実現。....

14.5k 1 時間前

フランスのAIスタートアップであるMistral AIがOCR4モデルを発表：170の言語をカバーし、インタラクション体験がより人間らしい

Mistral AIがOCR4モデルをリリース：170の言語をサポートし、GPTおよびGeminiを凌駕する出力品質

仏Mistral AIが文書認識モデルOCR 4を発表。10語族170言語に対応し、ベンチマークで93.07点を獲得。出力品質は人間評価でGPT-5.5 Proなどを上回る。小型で包括的、多様なシーンに対応する文書認識専用モデル。....

14.1k 47 分前

Mistral AIがOCR4モデルをリリース：170の言語をサポートし、GPTおよびGeminiを凌駕する出力品質

通義千問のカメラ機能が進化！図形を選択し、推論ができる。三甲医師による実測で認められた

アリババ傘下の通義千問APPは2026年5月27日、「写真で健康相談」機能をアップグレード。従来のOCRの限界を超え、医学画像理解と臨床推論を実現。新機能には、検査結果や患部の異常領域を自動マークするビジュアル選択機能、年齢・性別・複数指標の関連性を考慮した除外分析による診断精度向上の連動推論が含まれる。....

通義千問のカメラ機能が進化！図形を選択し、推論ができる。三甲医師による実測で認められた

AI日報：バイツーが香港科技大学と共同でMMProLongを発表；騰訊imaはCopilotを開示；紅果短劇はAI仮想人間の短編ドラマの保証制度を取りやめ

【AI日報】へようこそ！ここは毎日、人工知能の世界を探求するためのガイドです。毎日、AI分野のトレンドを紹介し、開発者に焦点を当てて、技術のトレンドを理解し、革新的なAI製品の応用を学ぶお手伝いをします。新着のAI製品についてはこちらから確認してください：https://app.aibase.com/zh1、バイツーが香港科技大学と共同でMMProLongを発表：長文LMMの訓練・質問対応効率はOCR変換を大幅に上回る。バイツーと香港科技大学が共同で発表したMMProLongモデルは、

26.2k 20 時間前

AI日報：バイツーが香港科技大学と共同でMMProLongを発表；騰訊imaはCopilotを開示；紅果短劇はAI仮想人間の短編ドラマの保証制度を取りやめ

AI製品

もっと見る

ハンドOCR

ハンドOCR

画像とPDFを高速にテキストに変換できる先進的なAI技術を基盤とするオンラインOCRツール。

音声をテキストに変換

画像の説明

画像の説明

AI駆動で、画像や動画を説明、OCR、Altテキストなどの様々な形式に変換します。

AIデザインツール

HandOCR

HandOCR

無料のオンラインAI OCRで、画像を瞬時に編集可能なテキストに変換し、正確で安全です。

効率ツール

PDFからMarkdownへの変換ツール

PDFからMarkdownへの変換ツール

PDFファイルをMarkdown形式に高速で変換し、元のスタイルを保持します。

モデル

もっと見る

qwen3-vl-235b-a22b-thinking

Alibaba

qwen3-vl-235b-a22b-thinking

$2

入力トークン/百万

$20

出力トークン/百万

-

コンテキスト長

Qianfan-VL-70B

Baidu

Qianfan-VL-70B

-

入力トークン/百万

-

出力トークン/百万

32

コンテキスト長

Qianfan-VL-8B

Baidu

Qianfan-VL-8B

-

入力トークン/百万

-

出力トークン/百万

32

コンテキスト長

Qianfan-QI-VL

Baidu

Qianfan-QI-VL

-

入力トークン/百万

-

出力トークン/百万

32

コンテキスト長

QianfanHuijin-8B

Baidu

QianfanHuijin-8B

-

入力トークン/百万

-

出力トークン/百万

32

コンテキスト長

Qianfan-Llama-VL-8B

Baidu

Qianfan-Llama-VL-8B

-

入力トークン/百万

-

出力トークン/百万

32

コンテキスト長

MiniMax Hailuo-02 512P

Minimax

MiniMax Hailuo-02 512P

-

入力トークン/百万

-

出力トークン/百万

-

コンテキスト長

ERNIE 4.5 Turbo VL

Baidu

ERNIE 4.5 Turbo VL

$3

入力トークン/百万

$9

出力トークン/百万

128

コンテキスト長

MCP

もっと見る

maamcp

Maamcp

MaaFrameworkに基づくMCPサーバーで、AIアシスタントにAndroidデバイスとWindowsデスクトップの自動化機能を提供し、OCR認識、クリック、スライド、テキスト入力などの操作をサポートし、操作プロセスを再利用可能なPipelineに変換できます。

3.5ポイント

handwriting-ocr-mcp-server

Handwriting Ocr Mcp Server

手書きOCRのMCPサーバー

2.5ポイント

mcp-florence2

Mcp Florence2

Florence-2に基づくMCP画像処理サービス

2.5ポイント

ddddocr-captcha-mcp

Ddddocr Captcha Mcp

ddddocrに基づくCAPTCHA識別MCPサーバーで、テキストOCR、物体検出、スライダーマッチング機能を提供します。

2.5ポイント

rapidocr-mcp

Rapidocr Mcp

RapidOCRに基づくMCPサーバーで、便利なOCRインターフェースサービスを提供します。

2.5ポイント

image-description-mcp_server

Image Description Mcp_server

xAI Grok APIに基づくMCPサーバーで、AI画像分析機能を提供し、URLとローカルファイルの画像記述、メタデータ抽出、OCR文字認識をサポートします。

2.5ポイント

foxit-pdf-api-mcp-server

Foxit Pdf Api Mcp Server

Foxit PDF APIのMCPサーバーの実装で、PythonとTypeScriptのバージョンが提供され、Foxit PDFサービスの35以上の操作（作成、変換、編集、セキュリティ、OCRなど）をAIエージェントが使用できるツールとして公開します。

2.5ポイント

fetch-mcp-server-y8a

Fetch Mcp Server Y8a

MCPサーバーはウェブページ内容の取得機能を提供し、ブラウザ自動化、OCR、および多様な方法による内容抽出をサポートし、LLMがJavaScriptレンダリングやクロール防止対策が施されたウェブページの内容を取得して処理するのを支援します。

2.5ポイント

textin-mcp

Textin Mcp

TextIn MCP Serverは文書テキスト抽出とOCRツールで、画像、PDF、Wordからテキストを認識し、重要な情報を抽出し、Markdown形式に変換することができます。

2.5ポイント

mcp-mistral-ocr

Mcp Mistral Ocr

Mistral AIのOCRサービスに基づき、ローカルファイルとURLの画像とテキストの認識をサポートします。

2.5ポイント

native-devtools-mcp

Native Devtools Mcp

native - devtools - mcpは、AIエージェントにmacOS、Windows、Androidシステムの自動化制御機能を提供するクロスプラットフォームのMCPサーバーです。スクリーンショット、OCR文字認識、クリック入力のシミュレーション、ウィンドウ管理、Androidデバイスの制御を含みます。

2.5ポイント

archive-agent

Archive Agent

Archive Agentは、自然言語によるファイル検索と質問に対応したインテリジェントなファイルインデックスツールです。AI検索（RAGエンジン）、自動OCR、MCPインターフェースを組み合わせ、テキスト、ドキュメント、PDF、画像などのさまざまなファイルタイプを処理できます。

2.5ポイント

remarkable-mcp

Remarkable Mcp

これはreMarkableタブレットのMCPサーバーで、AIアシスタントがあなたのreMarkableライブラリ全体を読み取り、検索し、走査できるようにします。OCRを通じた手書きノートの認識を含み、タブレットをAIがアクセス可能な「第二の脳」に変えます。

2.5ポイント

Handwriting OCR MCP server

Handwriting OCR MCP server

手書きOCRのMCPサーバーで、文書アップロード、状態確認、テキスト取得機能を提供します。

2.5ポイント

mcp-image-recognition

Mcp Image Recognition

画像認識機能を提供するMCPサーバーで、AnthropicとOpenAIのビジョンAPIをサポートし、画像説明、複数形式のサポート、主備えのサービスプロバイダーの設定、OCRテキスト抽出機能を備えています。

2.5ポイント

macOS Screenshot

MacOS Screenshot

スクリーンショットとOCRテキスト認識機能を提供するMCPサーバー

2.5ポイント

nutrient-dws-mcp-server

Nutrient Dws Mcp Server

ニュートリエントDWS MCPサーバーは、ニュートリエントドキュメントWebサービスプロセッサAPIと統合されたモデルコンテキストプロトコルサーバーで、AIアシスタントに強力なPDF処理機能を提供します。デジタル署名、ドキュメント生成、編集、OCR、透かし、塗りつぶしなどの操作が可能です。

2.5ポイント

computer-control-mcp

Computer Control Mcp

コンピュータ制御機能を提供するMCPサーバーで、マウスとキーボードの制御、OCR認識、ウィンドウ管理などが含まれ、PyAutoGUIとRapidOCRに基づいて実現され、外部依存関係はありません。

2.5ポイント

ragstack-lambda

Ragstack Lambda

RAGStack - Lambdaは、AWS LambdaベースのサーバーレスAIドキュメントとメディア処理プラットフォームで、ドキュメント、画像、ビデオ、オーディオのアップロードをサポートし、OCR、文字起こし、ベクトル化技術を通じて知識ベースを構築し、情報源の追跡付きのAIチャット機能を提供します。使用量に応じて課金され、アイドル時のコストがゼロのアーキテクチャを採用しています。

2.5ポイント

Computer Control

Computer Control

コンピュータ制御機能を提供するMCPサーバーで、マウス・キーボード制御、スクリーンショット、OCR文字認識などが含まれ、クロスプラットフォームで動作し、外部依存が不要です。

2.5ポイント

AIBase

未来を力づける、あなたの人工知能ソリューションシンクタンク

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AI Marketing LLM Leaderboard AI Ranking

© 2026AIBase

ビジネス協力サイトマップ