Firecrawl推出LLM.txt API:提供網址即可生成任意網站的LLM.txt
近日,Firecrawl 推出了一項全新的功能 ——LLMs.txt 生成器接口(Alpha 版),旨在幫助用戶將任何網站的內容轉化爲清晰、適用於大語言模型(LLM)訓練的文本文件。用戶只需提供一個網站的 URL,Firecrawl 便會對該網站及其鏈接頁面進行抓取,生成兩種格式的文本文件:llms.txt 和 llms-full.txt,便於後續的分析和訓練。該生成器的工作流程相對簡單。用戶只需提供一個網址,系統便會自動爬取該網站的內容,提取出乾淨且有意義的文本信息。生成的文件分爲兩種類型:llms.txt 是對網站內容的簡明總結,