探索AI前沿,掌握行业发展趋势
每日精选AI热点,追踪最新行业动态
精准筛选产品,多维度产品调研
热门AI产品实力、热度、年/月/日排行
提交AI产品信息,助力产品推广和用户转化
一站式AI工具指南,快速找到你需要的工具
涵盖各类AI模型,满足你的开发与研究需求
热门AI大模型性能、热度、年/月/日排行
寻找优质模型提供商,获取可靠模型支持
提交模型信息和服务,精准推广和触达用户
多维度对比大模型,找到最适合你的模型
精准计算大模型使用成本,合理规划预算
多模型实时评测,模型输出结果快速比对
聚集热门MCP服务,快速找到适合你的服务
轻松接入MCP客户端,调用强大的AI能力
学习MCP使用技巧,从入门到精通
热门MCP服务性能排行,帮你找到最佳选择
发布你的MCP服务,推广你的MCP服务
自由测试MCP服务,线上快速体验
快速测试MCP服务,快速上线
通过AI搜索优化服务,让品牌在AI中实现霸屏
检测品牌在AI平台中的可见度
一键检测电脑配置,研判运行模型的兼容性
提供用于训练、评估和测试模型的数据集
提供各类文档文字提取,支持自定义场景
发现与 Asynchronous Advantage Actor Critic 相关的最受欢迎的开源项目和工具,了解最新的开发趋势和创新。
简单的强化学习教程,莫烦Python中文AI教学
高质量的单文件深度强化学习算法实现,包含便于研究的特性(PPO、DQN、C51、DDPG、TD3、SAC、PPG)
DQN、AC、ACER、A2C、A3C、PG、DDPG、TRPO、PPO、SAC、TD3等强化学习算法的PyTorch实现
来自免费课程《使用TensorFlow和PyTorch进行深度强化学习》的实践代码
使用PyTorch实现的优势行动者评论家算法(A2C)、近端策略优化算法(PPO)、基于克罗内克因子近似的深度强化学习可扩展信任域方法(ACKTR)以及生成对抗模仿学习(GAIL)。
基于PyTorch的深度强化学习算法模块化实现
基于PyTorch的去中心化深度学习框架,旨在让全球数千名志愿者参与模型训练。
软强化学习是一个用于在连续域中训练最大熵策略的强化学习框架。包含软演员评论家算法的官方实现。
基于论文《深度强化学习的异步方法》的异步优势行动者评论家 (A3C) 的 PyTorch 实现。
PyTorch实现的软演员评论家算法(SAC)、双延迟DDPG算法(TD3)、演员评论家算法(AC/A2C)、近端策略优化算法(PPO)、QT-Opt算法和PointNet。
? Stateful Serverless That Runs Anywhere. The easiest way to build stateful, AI agent, collaborative, or local-first applications. Deploy to Rivet, Cloudflare, Bun, Node.js, and more.
ChainerRL是一个基于Chainer构建的深度强化学习库。
包含用PyTorch编写的、高质量的深度强化学习算法实现。
基于深度强化学习算法(包括Q学习、DQN、PPO、DDPG、TD3、SAC、A2C等)的32个项目,每个项目都提供了详细的训练日志。
软演员评论家算法的PyTorch实现
适用于Rivet、Cloudflare Workers、Bun和Node.js的无服务器状态框架。用于构建AI智能体、实时应用、游戏服务器等。
使用OpenAI Gym和TensorFlow掌握强化学习和深度强化学习
用于序列到序列模型的深度强化学习
强化学习教程及演示:动态规划(策略迭代和值迭代)、蒙特卡洛方法、时序差分学习(SARSA、Q学习)、函数逼近、策略梯度、深度Q网络(DQN)、模仿学习、元学习,以及相关的论文、课程等。
一个用于构建深度强化学习智能体的PyTorch库。