Armaggheddon
YOLOv11アーキテクチャに基づく3種類の文書レイアウト分析モデル(nano、small、medium)で、DocLayNetデータセットで微調整され、文書内のテキスト、表、グラフなど11種類のレイアウト要素を正確に検出でき、文書理解と情報抽出タスクに適しています。
yifeihu
DocLayNetデータセットでファインチューニングされたFlorence-2モデル、ドキュメントレイアウト分析タスク専用、カテゴリ名の簡略化により性能向上
Aryn
DocLayNetデータセットでトレーニングされた変形可能DETRモデルで、ドキュメントレイアウト分析における物体検出タスクに使用され、57.1のbox mAP指標を達成しました。
pierreguillou
このモデルはLayoutXLMベースモデルをDocLayNetデータセットで微調整したバージョンで、ドキュメントレイアウト分析と段落レベルの内容理解に特化しています。
Mit1208
LayoutLMv3アーキテクチャをファインチューニングしたドキュメントレイアウト分析モデルで、DocLayNetデータセット内のドキュメント要素分類タスク専用に設計されています。
LayoutXLMベースモデルをDocLayNetデータセットで微調整した行レベルドキュメント理解モデルで、多言語ドキュメントのレイアウト分析とマーク分類をサポートします。
LiLTとDocLayNetデータセットでファインチューニングされた行レベルドキュメント理解モデル、多言語ドキュメントレイアウト分析をサポート