探索AI前沿,掌握行业发展趋势
每日精选AI热点,追踪最新行业动态
精准筛选产品,多维度产品调研
热门AI产品实力、热度、年/月/日排行
提交AI产品信息,助力产品推广和用户转化
一站式AI工具指南,快速找到你需要的工具
企业级监测平台,全域追踪品牌在 12+ AI 平台的表现
输入品牌生成综合健康度得分,快速定位整体位置与短板
单次提问,立刻看到品牌在多个 AI 平台回答中的排名
批量问题 × 定频GEO排名查询 长期追踪排名变化曲线
挖出用户会问 AI 的高热度问题,决定做哪些内容
追踪投放的推广链接,评估哪些渠道真正被 AI 引用
拥有属于自己的GEO系统,助您成为专业GEO优化服务商
通过AI搜索优化服务,让品牌在AI中实现霸屏
聚集热门MCP服务,快速找到适合你的服务
轻松接入MCP客户端,调用强大的AI能力
学习MCP使用技巧,从入门到精通
热门MCP服务性能排行,帮你找到最佳选择
发布你的MCP服务,推广你的MCP服务
自由测试MCP服务,线上快速体验
快速测试MCP服务,快速上线
国内外主流大模型的统一API接入与调用服务
涵盖各类AI模型,满足你的开发与研究需求
寻找优质模型提供商,获取可靠模型支持
热门AI大模型性能、热度、年/月/日排行
帮助检测挑选可以放心使用的大模型中转站
多维度对比大模型,找到最适合你的模型
精准计算大模型使用成本,合理规划预算
多模型实时评测,模型输出结果快速比对
一键检测电脑配置,研判运行模型的兼容性
根据算力需求,推荐匹配的服务器配置
发现与 Rl 相关的最受欢迎的开源项目和工具,了解最新的开发趋势和创新。
一本易懂的强化学习中文教程(也称“蘑菇书”),可以在线阅读:https://datawhalechina.github.io/easy-rl/
多巴胺(Dopamine)是一个用于快速原型设计强化学习算法的研究框架。
麻省理工学院深度学习相关课程的教程、作业和竞赛。
一个优雅的PyTorch深度强化学习库。
大规模并行深度强化学习
五子棋(也叫戈邦或五子连珠)的AlphaZero算法实现
开放式决策AI引擎,最全面的强化学习框架
一个模块化、优先使用原始方法、优先使用 Python 的 PyTorch 强化学习库。
大型语言模型推理的分布式强化学习系统
一个用于元学习研究的PyTorch库
MuZero
一个用于Stable Baselines3强化学习智能体的训练框架,包含超参数优化和预训练智能体。
英特尔人工智能实验室的强化学习教练(Reinforcement Learning Coach)让您可以轻松地试验最先进的强化学习算法。
Awesome Reinforcement Learning for Large Reasoning Models (RL4LRM)
?100+ LLM & RL Algorithm Maps!? | 原创 LLM / RL 100+原理图?,由《大模型算法》作者发起
DeepTraffic是一个深度强化学习竞赛,属于麻省理工学院深度学习系列的一部分。
RLinf is a flexible and scalable open-source infrastructure designed for post-training foundation models (LLMs, VLMs, VLAs) via reinforcement learning.
一个离线深度强化学习库
关于深度强化学习和人工智能的未来
深度强化学习中基于好奇心驱动的探索方法的TensorFlow代码(发表在ICML 2017)