car-racing-ppo
Public在连续动作空间的OpenAI Gym环境(Box2D/Car Racing v0)中,实现了深度强化学习算法近端策略优化(Proximal Policy Optimization,SOTA)。
创建时间:2019-02-26T22:34:58
更新时间:2025-02-14T20:43:15
45
Stars
0
Stars Increase
在连续动作空间的OpenAI Gym环境(Box2D/Car Racing v0)中,实现了深度强化学习算法近端策略优化(Proximal Policy Optimization,SOTA)。