OpenDataLabとDingTalkが共同でDLU文書解析ツールをリリース。オープンソースエンジンMinerUを基に開発され、多様なフォーマットに対応。企業の効率的な文書処理を支援。MinerUはGitHubで4万以上のスターを獲得。DLUもオープンソース化予定でAI普及を促進。....
2024年のWAIC科学最前線フォーラムにおいて、上海人工知能研究所(上海AI研究所)の大規模モデルデータ基盤OpenDataLabチームは、MinerUという新しいインテリジェントデータ抽出ツールを発表しました。このツールはAIデータ処理のワークフローを簡素化し、AI研究者が膨大な量の文書から高品質なデータ抽出を支援することを目的としています。
大規模言語モデル等を支える、高品質なオープンデータセットプラットフォーム
moonstruxx
これはopendatalab/MinerU2.5-2509-1.2Bから変換されたMLX形式の大規模言語モデルで、パラメータ規模は12億で、Apple Siliconチップに特化して最適化され、FP16精度の推論をサポートしています。