["GPT Crawler是一款革命性的AI工具,利用自然語言處理技術從網頁中提取知識。","與傳統爬蟲不同,它轉化非結構化網頁內容爲有組織知識,拓展了信息提取、定製化GPT模型和個性化AI交互領域。","研究人員可使用定製GPT回答特定問題,通過提供Builder文檔URL即可創建個性化GPT。","GPT Crawler的出現將改變人們與信息交互方式,爲AI領域帶來新的可能性。"]
開源的網頁爬蟲,支持AI技術目錄更新和網站摘要。
超快速的網絡爬蟲與數據抓取API
從URL爬取知識文件以創建自定義GPT
infinitejoy
這是一個使用Unity ML-Agents庫訓練的PPO智能體模型,專門用於Crawler環境中的強化學習任務。
MCP Smart Crawler 是一個基於Playwright的網頁內容爬取工具,專門用於提取小紅書帖子的元數據和下載媒體資源。
WebSearch-MCP是一個實現Model Context Protocol(MCP)的服務,通過集成WebSearch Crawler API提供網頁搜索能力,支持多種AI客戶端即時獲取網絡信息。
Web爬蟲MCP服務器部署指南
一個基於MCP協議的開發文檔服務器,提供文檔爬取、本地加載、精準搜索和詳情獲取功能,解決AI開發中的文檔幻覺問題。
該項目提供了一套工具集,用於爬取網站內容並生成Markdown文檔,同時通過MCP服務器實現文檔的語義搜索功能,支持與Cursor等工具集成。