AIbase
Biblioteca de productosNavegación de herramientasMCP

PPO-Algorithms

Public

Experiments of the three PPO-Algorithms (PPO, clipped PPO, PPO with KL-penalty) proposed by John Schulman et al. on the 'Cartpole-v1' environment.

Hora de creación2021-11-13T02:51:04
Hora de actualización2024-09-14T02:46:45
13
Stars
0
Stars Increase

Proyectos relacionados