OpenDataLab與釘釘聯合推出DLU文檔解析工具,基於開源引擎MinerU開發,支持多種格式,助力企業高效處理專業內容。MinerU在GitHub獲超4萬星標,2.0版本性能優異。DLU即將開源,推動AI應用普及。
在2024年WAIC科學前沿主論壇上,上海人工智能實驗室(上海AI實驗室)大模型數據基座OpenDataLab團隊發佈了一款名爲MinerU的全新智能數據提取工具。這款工具旨在簡化AI數據處理流程,幫助AI研究者從海量文檔中提取高質量數據。
高質量開放數據集平臺,為大型模型提供數據支持
moonstruxx
這是一個基於opendatalab/MinerU2.5-2509-1.2B轉換而來的MLX格式大語言模型,參數規模為12億,專門針對Apple Silicon芯片優化,支持FP16精度推理。