OpenDataLab與釘釘聯合推出DLU文檔解析工具,基於開源引擎MinerU開發,支持多種格式,助力企業高效處理專業內容。MinerU在GitHub獲超4萬星標,2.0版本性能優異。DLU即將開源,推動AI應用普及。
在2024年WAIC科學前沿主論壇上,上海人工智能實驗室(上海AI實驗室)大模型數據基座OpenDataLab團隊發佈了一款名爲MinerU的全新智能數據提取工具。這款工具旨在簡化AI數據處理流程,幫助AI研究者從海量文檔中提取高質量數據。
一站式開源高質量數據提取工具,將PDF轉換成Markdown和JSON格式。
moonstruxx
這是一個基於opendatalab/MinerU2.5-2509-1.2B轉換而來的MLX格式大語言模型,參數規模為12億,專門針對Apple Silicon芯片優化,支持FP16精度推理。
kitjesen
該模型能夠將PDF文檔轉換為Markdown格式,保持原始文檔排版結構,準確識別數學公式和表格。
MySQL MCP服務器是一個基於MCP協議的MySQL數據庫操作服務,提供AI模型與MySQL交互的工具集,支持Docker部署和多種數據庫操作功能。