Jina AI 發佈革命性小模型,輕鬆將HTML轉爲優雅 Markdown!
Jina AI 推出了兩款專門爲將原始 HTML 內容轉化爲乾淨整潔的 Markdown 格式而設計的小型語言模型,讓我們擺脫瑣的網頁數據處理。這款名爲 Reader-LM 的模型,最大的亮點在於它能夠快速且高效地將網頁內容轉換爲 Markdown 文件。使用它的好處在於,你不再需要依賴複雜的規則或者費力的正則表達式。這些模型聰明地自動剔除了網頁中的雜亂內容,比如廣告、腳本和導航欄,最終呈現出條理清晰的 Markdown 格式。Reader-LM 提供了兩個不同參數的模型,分別是 Reader-LM-0.5B 和 Reader-LM-1.5B。雖然這兩個模