AIbase
产品库工具导航

PPO-LunarLander

Public

使用PyTorch,基于近端策略优化(PPO)的强化学习智能体在LunarLander-v2环境中实现火箭着陆

创建时间2025-04-07T22:27:39
更新时间2025-04-09T19:16:25
0
Stars
0
Stars Increase