説明はありません
olmOCR-7B-0225-previewは、Qwen2-VL-7B-Instructをファインチューニングしたドキュメント画像認識モデルであり、ドキュメントをプレーンテキストに効率的に変換するために使用されます。
olmOCRは、LLMデータセットのトレーニングに使用するためにPDFを線形化するツールキットです。
richardyoung
olmOCR-2-7B-1025はAllenAIによって開発された高品質のOCR視覚言語モデルで、文書や画像内の文字認識タスクを専門に処理するためのものです。このリポジトリでは、Q8_0量子化方式を用いたGGUF量子化バージョンを提供しており、モデルサイズを小さくしながらも優れた精度を維持しています。
bartowski
これはallenaiのolmOCR-2-7B-1025モデルを量化処理したバージョンで、llama.cppツールを使用して複数の量化レベルのモデルファイルを生成し、異なるハードウェア条件とニーズを持つユーザーが使用しやすくなっています。このモデルはLM Studioまたはllama.cppベースのプロジェクトで実行できます。
allenai
olmOCR-2-7B-1025のFP8量子化バージョンで、Qwen2.5-VL-7B-Instructをベースに微調整され、数式や表などの複雑なOCRシーンを処理するためのビジョン言語モデルです。
これはQwen2.5-VL-7B-Instructをベースに微調整されたFP8量子化バージョンのOCRモデルで、ドキュメント画像のテキスト認識に特化しており、効率的な大規模ドキュメント処理をサポートします。
olmOCR-7B-0725-FP8は、Qwen2.5-VL-7B-Instructモデルをベースに、olmOCR-mix-0225データセットで微調整した後、FP8バージョンに量子化した文書OCRモデルです。
tngtech
olmOCR-7B-0225-previewをファインチューニングしたバージョンで、文書内の全ての情報(ヘッダー・フッター内容を含む)を完全に抽出することに特化しています。
Adun
最適化されたolmOCRモデルで、タイ語テキスト認識の精度向上に特化し、多言語と表形式をサポートします。
olmOCRは、Qwen2-VL-7B-Instructをベースに微調整された光学文字認識モデルで、PDFなどの画像コンテンツをテキストに変換することに特化しており、微調整により特定シーンでの認識精度を向上させています。
DevQuasar
olmOCR-7B-0225-preview は AllenAI によって開発されたOCR技術に基づく画像テキストからテキストへの変換モデルで、画像からテキスト内容を抽出・認識することを目的としています。
FriendliAI
Qwen2-VL-7B-InstructをファインチューニングしたドキュメントOCRモデルで、多言語ドキュメント認識とメタデータ抽出をサポート