AIbase
Biblioteca de productosNavegación de herramientas

rlhf-trl

Public

Reinforcement Learning from Human Feedback with ? TRL

Hora de creación2023-06-10T23:16:02
Hora de actualización2025-03-23T22:12:20
9
Stars
0
Stars Increase