AIbase
Biblioteca de productosNavegación de herramientasMCP

MA-RLHF

Public

[ICLR'25] MA-RLHF: Reinforcement Learning from Human Feedback with Macro Actions

Hora de creación2024-09-27T11:48:28
Hora de actualización2025-03-09T03:23:44
https://openreview.net/forum?id=WWXjMYZxfH
7
Stars
0
Stars Increase