Search-R1
推論と検索エンジンの呼び出しを行う言語モデルをトレーニングするための、効率的な強化学習フレームワークです。
一般製品生産性強化学習自然言語処理
Search-R1は、推論を行い、検索エンジンを呼び出すことができる大規模言語モデル(LLM)をトレーニングすることを目的とした強化学習フレームワークです。veRLをベースに構築されており、様々な強化学習手法と異なるLLMアーキテクチャをサポートしており、ツール拡張推論の研究開発において、効率性と拡張性を備えています。
Search-R1 最新のトラフィック状況
月間総訪問数
513197610
直帰率
36.07%
平均ページ/訪問
6.1
平均訪問時間
00:06:32