OpenDataLab与钉钉联合推出DLU文档解析工具,基于开源引擎MinerU开发,支持多种格式,助力企业高效处理专业内容。MinerU在GitHub获超4万星标,2.0版本性能优异。DLU即将开源,推动AI应用普及。
在2024年WAIC科学前沿主论坛上,上海人工智能实验室(上海AI实验室)大模型数据基座OpenDataLab团队发布了一款名为MinerU的全新智能数据提取工具。这款工具旨在简化AI数据处理流程,帮助AI研究者从海量文档中提取高质量数据。
一站式开源高质量数据提取工具,将PDF转换成Markdown和JSON格式。
moonstruxx
这是一个基于opendatalab/MinerU2.5-2509-1.2B转换而来的MLX格式大语言模型,参数规模为12亿,专门针对Apple Silicon芯片优化,支持FP16精度推理。
kitjesen
该模型能够将PDF文档转换为Markdown格式,保持原始文档排版结构,准确识别数学公式和表格。
MySQL MCP服务器是一个基于MCP协议的MySQL数据库操作服务,提供AI模型与MySQL交互的工具集,支持Docker部署和多种数据库操作功能。