OpenDataLab与钉钉联合推出DLU文档解析工具,基于开源引擎MinerU开发,支持多种格式,助力企业高效处理专业内容。MinerU在GitHub获超4万星标,2.0版本性能优异。DLU即将开源,推动AI应用普及。
上海人工智能实验室发布OpenDataArena平台,将AI训练数据价值评估从主观判断转变为科学测量。该平台解决了研究者筛选海量数据时难以识别高质量数据的痛点,使数据筛选工作告别"黑盒操作"时代。
在2024年WAIC科学前沿主论坛上,上海人工智能实验室(上海AI实验室)大模型数据基座OpenDataLab团队发布了一款名为MinerU的全新智能数据提取工具。这款工具旨在简化AI数据处理流程,帮助AI研究者从海量文档中提取高质量数据。
高质量开放数据集平台,为大型模型提供数据支持
moonstruxx
这是一个基于opendatalab/MinerU2.5-2509-1.2B转换而来的MLX格式大语言模型,参数规模为12亿,专门针对Apple Silicon芯片优化,支持FP16精度推理。
Open Data MCP是一个开源项目,旨在通过MCP协议将公开数据集快速接入LLM应用,实现开放数据的便捷访问和社区化发布。
这是一个基于Model Context Protocol的韩国公共数据门户OpenAPI集成工具,提供API搜索、文档获取和数据调用功能,简化了韩国公共数据的访问流程。