AIbase

car-racing-ppo

Public

在连续动作空间的OpenAI Gym环境(Box2D/Car Racing v0)中,实现了深度强化学习算法近端策略优化(Proximal Policy Optimization,SOTA)。

创建时间2019-02-26T22:34:58
更新时间2025-02-14T20:43:15
45
Stars
0
Stars Increase