OpenDataLabとDingTalkが共同でDLU文書解析ツールをリリース。オープンソースエンジンMinerUを基に開発され、多様なフォーマットに対応。企業の効率的な文書処理を支援。MinerUはGitHubで4万以上のスターを獲得。DLUもオープンソース化予定でAI普及を促進。....
2024年のWAIC科学最前線フォーラムにおいて、上海人工知能研究所(上海AI研究所)の大規模モデルデータ基盤OpenDataLabチームは、MinerUという新しいインテリジェントデータ抽出ツールを発表しました。このツールはAIデータ処理のワークフローを簡素化し、AI研究者が膨大な量の文書から高品質なデータ抽出を支援することを目的としています。
PDFをMarkdownおよびJSON形式に変換する、ワンストップ型の高品質なオープンソースデータ抽出ツールです。
moonstruxx
これはopendatalab/MinerU2.5-2509-1.2Bから変換されたMLX形式の大規模言語モデルで、パラメータ規模は12億で、Apple Siliconチップに特化して最適化され、FP16精度の推論をサポートしています。
kitjesen
このモデルはPDF文書をMarkdown形式に変換し、元の文書のレイアウト構造を保持し、数学式や表を正確に認識します。
MySQL MCPサーバーは、MCPプロトコルに基づくMySQLデータベース操作サービスで、AIモデルとMySQLのやり取りを可能にするツールセットを提供し、Dockerデプロイとさまざまなデータベース操作機能をサポートします。