OpenDataLab与钉钉联合推出DLU文档解析工具,基于开源引擎MinerU开发,支持多种格式,助力企业高效处理专业内容。MinerU在GitHub获超4万星标,2.0版本性能优异。DLU即将开源,推动AI应用普及。
在2024年WAIC科学前沿主论坛上,上海人工智能实验室(上海AI实验室)大模型数据基座OpenDataLab团队发布了一款名为MinerU的全新智能数据提取工具。这款工具旨在简化AI数据处理流程,帮助AI研究者从海量文档中提取高质量数据。
高质量开放数据集平台,为大型模型提供数据支持
moonstruxx
这是一个基于opendatalab/MinerU2.5-2509-1.2B转换而来的MLX格式大语言模型,参数规模为12亿,专门针对Apple Silicon芯片优化,支持FP16精度推理。