AIbase

pytorch-a2c-ppo-acktr-gail

Public

使用PyTorch实现的优势行动者评论家算法(A2C)、近端策略优化算法(PPO)、基于克罗内克因子近似的深度强化学习可扩展信任域方法(ACKTR)以及生成对抗模仿学习(GAIL)。

创建时间2017-08-22T23:57:25
更新时间2025-08-09T00:40:58
3.8K
Stars
1
Stars Increase