AIbase

MA-RLHF

Public

《ICLR 2025论文:基于宏动作的人类反馈强化学习 (MA-RLHF)》

创建时间2024-09-27T11:48:28
更新时间2025-06-30T23:13:18
https://openreview.net/forum?id=WWXjMYZxfH
7
Stars
0
Stars Increase

相关项目