Jina AI 发布革命性小模型,轻松将HTML转为优雅 Markdown!
Jina AI 推出了两款专门为将原始 HTML 内容转化为干净整洁的 Markdown 格式而设计的小型语言模型,让我们摆脱琐的网页数据处理。这款名为 Reader-LM 的模型,最大的亮点在于它能够快速且高效地将网页内容转换为 Markdown 文件。使用它的好处在于,你不再需要依赖复杂的规则或者费力的正则表达式。这些模型聪明地自动剔除了网页中的杂乱内容,比如广告、脚本和导航栏,最终呈现出条理清晰的 Markdown 格式。Reader-LM 提供了两个不同参数的模型,分别是 Reader-LM-0.5B 和 Reader-LM-1.5B。虽然这两个模