["GPT Crawler是一款革命性的AI工具,利用自然语言处理技术从网页中提取知识。","与传统爬虫不同,它转化非结构化网页内容为有组织知识,拓展了信息提取、定制化GPT模型和个性化AI交互领域。","研究人员可使用定制GPT回答特定问题,通过提供Builder文档URL即可创建个性化GPT。","GPT Crawler的出现将改变人们与信息交互方式,为AI领域带来新的可能性。"]
开源的网页爬虫,支持AI技术目录更新和网站摘要。
超快速的网络爬虫与数据抓取API
从URL爬取知识文件以创建自定义GPT
infinitejoy
这是一个使用Unity ML-Agents库训练的PPO智能体模型,专门用于Crawler环境中的强化学习任务。
一个基于MCP协议的开发文档服务器,提供文档爬取、本地加载、精准搜索和详情获取功能,解决AI开发中的文档幻觉问题。
Web爬虫MCP服务器部署指南
WebSearch-MCP是一个实现Model Context Protocol(MCP)的服务,通过集成WebSearch Crawler API提供网页搜索能力,支持多种AI客户端实时获取网络信息。
MCP Smart Crawler 是一个基于Playwright的网页内容爬取工具,专门用于提取小红书帖子的元数据和下载媒体资源。
该项目提供了一套工具集,用于爬取网站内容并生成Markdown文档,同时通过MCP服务器实现文档的语义搜索功能,支持与Cursor等工具集成。