AIbase

trafilatura

Public

一款Python命令行工具,用于收集网络文本和元数据:爬取、抓取、提取数据,并输出为CSV、JSON、HTML、MD、TXT、XML等多种格式。

创建时间2019-04-08T19:38:48
更新时间2025-07-16T10:15:57
https://trafilatura.readthedocs.io
4.5K
Stars
2
Stars Increase