car-racing-ppo

Public

在连续动作空间的OpenAI Gym环境（Box2D/Car Racing v0）中，实现了深度强化学习算法近端策略优化（Proximal Policy Optimization，SOTA）。

deep-reinforcement-learning openai-gym policy-optimization ppo proximal-policy-optimization

创建时间：2019-02-26T22:34:58

更新时间：2025-02-14T20:43:15

Stars

Stars Increase

相关项目

Tensorflow

人人皆可使用的开源机器学习框架

AutoGPT

AutoGPT 的愿景是让每个人都能轻松使用和开发人工智能。我们的使命是提供必要的工具，让您专注于更重要的事情。

176992

2个月前

+23today

Stable Diffusion Webui

Stable Diffusion 的网页版界面

154604

1年前

+45today

Transformers

Hot

bert

Pytorch、TensorFlow和JAX框架下最先进的机器学习转换器

147095

2年前

+57today

30 Seconds Of Code

提升开发技能的编程文章

Dify

Hot

agent

Dify是一个开源的大型语言模型（LLM）应用开发平台。Dify拥有直观的界面，集成了AI工作流程、RAG管道、智能体功能、模型管理、可观测性功能等，让您可以快速地从原型开发到产品上线。

107430

3个月前

+182today

Generative Ai For Beginners

Hot

21堂课，开启生成式AI之旅！ https://microsoft.github.io/generative-ai-for-beginners/

91941

2个月前

+51today

Pytorch

autograd

Python中基于张量和动态神经网络的强大GPU加速计算

91575

3天前

+10today

Opencv

开源计算机视觉库

Netdata

洞悉你的基础设施！

AI开源&商用产品

AI产品提交

模型库

MCP服务端

MCP客户端

MCP服务调试

案例教程

AI热门资讯

今日AI热点