ホームAIチュートリアル

Project-vLLM

Public

An Easy-to-use, Scalable and High-performance RLHF Framework (70B+ PPO Full Tuning & Iterative DPO & LoRA & RingAttention & RFT)

作成時間2025-03-20T21:35:00
更新時間2025-03-21T16:32:33
0
Stars
0
Stars Increase

関連プロジェクト