OpenDataLab與釘釘聯合推出DLU文檔解析工具,基於開源引擎MinerU開發,支持多種格式,助力企業高效處理專業內容。MinerU在GitHub獲超4萬星標,2.0版本性能優異。DLU即將開源,推動AI應用普及。
上海人工智能實驗室發佈OpenDataArena平臺,將AI訓練數據價值評估從主觀判斷轉變爲科學測量。該平臺解決了研究者篩選海量數據時難以識別高質量數據的痛點,使數據篩選工作告別"黑盒操作"時代。
在2024年WAIC科學前沿主論壇上,上海人工智能實驗室(上海AI實驗室)大模型數據基座OpenDataLab團隊發佈了一款名爲MinerU的全新智能數據提取工具。這款工具旨在簡化AI數據處理流程,幫助AI研究者從海量文檔中提取高質量數據。
高質量開放數據集平臺,為大型模型提供數據支持
moonstruxx
這是一個基於opendatalab/MinerU2.5-2509-1.2B轉換而來的MLX格式大語言模型,參數規模為12億,專門針對Apple Silicon芯片優化,支持FP16精度推理。
Open Data MCP是一個開源項目,旨在通過MCP協議將公開數據集快速接入LLM應用,實現開放數據的便捷訪問和社區化發佈。
這是一個基於Model Context Protocol的韓國公共數據門戶OpenAPI集成工具,提供API搜索、文檔獲取和數據調用功能,簡化了韓國公共數據的訪問流程。