バイトダンス、大規模言語モデル訓練速度を20倍に向上させるオープンソースツール「HybridFlow」を発表!コストも大幅削減!
GPTやLlamaなどの大規模言語モデル(LLM)はAI分野に革命を起こしましたが、これらの巨大なモデルを効率的に訓練し、人間の価値観に沿わせる方法は依然として課題です。強化学習からのヒューマンフィードバック(RLHF)は重要なLLM訓練方法として近年広く利用されていますが、従来のRLHFフレームワークは柔軟性、効率性、拡張性に限界がありました。これらの問題を解決するため、バイトダンスのDoubao大規模言語モデルチームは、HybridFlowというRLHFフレームワークをオープンソース化しました。