发现与 Markdown Scraper 相关的最受欢迎的开源项目和工具,了解最新的开发趋势和创新。
将整个网站转换为 LLM 可用的 Markdown 或结构化数据。只需一个 API 即可抓取、爬取和提取数据。
Crawlee 是一个基于 Node.js 的网页抓取和浏览器自动化库,用于构建可靠的爬虫程序。它支持 JavaScript 和 TypeScript,可以提取数据用于 AI、大型语言模型 (LLM)、检索增强生成 (RAG) 或 GPT 等应用。它能够下载网站上的 HTML、PDF、JPG、PNG 等各种类型的文件。兼容 Puppeteer、Playwright、Cheerio、JSDOM 和原生 HTTP 请求。支持有头和无头模式,并提供代理轮换功能。
✍ WeChat Markdown Editor | 一款高度简洁的微信 Markdown 编辑器:支持 Markdown 语法、自定义主题样式、内容管理、多图床、AI 助手等特性
每天利用大型语言模型从海量信息和各种来源中挖掘你感兴趣的内容。
一款帮你记录和写作的智能笔记应用,支持多种设备。
一款高度可扩展的 Markdown 编辑器,具有版本控制、AI 辅助编程、思维导图、文档加密、代码片段运行、集成终端、图表嵌入、HTML 小程序、Reveal.js 演示文稿、插件和宏替换等功能。
利用大型语言模型将任何网页转换成结构化数据
基于飞桨的集大成式开发工具
一个由社区驱动,基于ChatGPT的阅读和与AI机器人聊天的方式
Backlog.md - A tool for managing project collaboration between humans and AI Agents in a git ecosystem
利用最先进的现代光学字符识别 (OCR) 技术和 Ollama 支持的模型,提供文档(PDF、Word、PPTX 等)提取和解析 API。 该 API 可对文档进行匿名化处理,移除个人身份信息 (PII),并将任何文档或图片转换为结构化的 JSON 或 Markdown 格式。
一个开源的 Python3 工具,使用小型模型识别图像中的布局、表格、数学公式(LaTeX)和文本,并将它们转换成 Markdown 格式。它是 Mathpix 的免费替代品,可以无缝地将视觉内容转换为文本表示。支持 80 多种语言。
一款由人工智能驱动的README文件生成器。
迅速提取音视频中的关键信息,并将其整理成结构清晰的Markdown笔记。
导出并分享你的 ChatGPT 聊天记录
一款强大的网页抓取工具,由大型语言模型 (LLM) 提供支持,包括 OpenAI、Gemini 和 Ollama。
在您的桌面上运行安全且本地化的 AI,内置 RAG 知识库和 Markdown 笔记支持。
用于大型语言模型的React库
这是一个利用多模态大型语言模型将PDF文件转换成Markdown格式的工具。
Basic Memory是一个知识管理系统,它允许你通过与AI助手对话来构建持久性的语义图谱。所有知识都存储在你电脑上的标准Markdown文件中,让你完全控制和拥有你的数据。它可以直接与Obsidian.md集成。