pytorch-a2c-ppo-acktr-gail
Public使用PyTorch实现的优势行动者评论家算法(A2C)、近端策略优化算法(PPO)、基于克罗内克因子近似的深度强化学习可扩展信任域方法(ACKTR)以及生成对抗模仿学习(GAIL)。
a2cacktractor-criticadvantage-actor-criticaleataricontinuous-controldeep-learningdeep-reinforcement-learninghessian
创建时间:2017-08-22T23:57:25
更新时间:2025-08-09T00:40:58
3.8K
Stars
1
Stars Increase