ZeroSearch
一种无需搜索即可激励 LLM 搜索能力的框架。
普通产品生产力强化学习搜索能力
ZeroSearch 是一种新颖的强化学习框架,旨在激励大型语言模型(LLMs)的搜索能力,而无需与实际搜索引擎进行交互。通过监督微调,ZeroSearch 转变 LLM 为能够生成相关和无关文档的检索模块,并引入课程推出机制来逐步激发模型的推理能力。该技术的主要优点在于其性能优于基于真实搜索引擎的模型,同时产生的 API 成本为零。它适用于各种规模的 LLM,并支持不同的强化学习算法,适合需要高效检索能力的研究和开发团队。
ZeroSearch 最新流量情况
月总访问量
492133528
跳出率
36.20%
平均页面访问数
6.1
平均访问时长
00:06:33