探索AI前沿,掌握行业发展趋势
每日精选AI热点,追踪最新行业动态
精准筛选产品,多维度产品调研
热门AI产品实力、热度、年/月/日排行
提交AI产品信息,助力产品推广和用户转化
一站式AI工具指南,快速找到你需要的工具
涵盖各类AI模型,满足你的开发与研究需求
热门AI大模型性能、热度、年/月/日排行
寻找优质模型提供商,获取可靠模型支持
多维度对比大模型,找到最适合你的模型
精准计算大模型使用成本,合理规划预算
多模型实时评测,模型输出结果快速比对
聚集热门MCP服务,快速找到适合你的服务
轻松接入MCP客户端,调用强大的AI能力
学习MCP使用技巧,从入门到精通
热门MCP服务性能排行,帮你找到最佳选择
发布你的MCP服务,推广你的MCP服务
自由测试MCP服务,线上快速体验
快速测试MCP服务,快速上线
一站式GEO品牌洞察 提升AI搜索转化率
分析并追踪人工智能模型如何引用您的品牌
检测品牌在AI平台中的可见度
快速评估推广文章在AI 平台的引用情况
拥有属于自己的GEO系统,助您成为专业GEO优化服务商
通过AI搜索优化服务,让品牌在AI中实现霸屏
一键检测电脑配置,研判运行模型的兼容性
根据算力需求,推荐匹配的服务器配置
发现与 Gumbel Muzero 相关的最受欢迎的开源项目和工具,了解最新的开发趋势和创新。
基于PyTorch的变分自动编码器(VAE)集合
MuZero
【NeurIPS 2023 聚焦论文】LightZero:一个用于通用顺序决策场景中蒙特卡洛树搜索的统一基准(强大的MCTS)
使用语义ID的生成式检索模型(基于论文《具有生成式检索的推荐系统》的PyTorch实现)
MuZero 的 PyTorch 实现
刑天是一个组件化的库,用于开发和验证强化学习算法。
基于PyTorch实现的随机量化变分自编码器(SQ-VAE)
NAACL 2019论文“SEQ^3:用于无监督抽象句子压缩的可微分序列到序列到序列自动编码器”的源代码
MiniZero:一个 AlphaZero 和 MuZero 训练框架
基于 Gumbel Softmax 的 TensorFlow GAN 实现
这是一个使用PyTorch实现的适用于Gym环境的随机MuZero算法。该算法能够支持各种动作空间和观测空间,包括离散和连续类型。
一个用 JAX 实现的 MuZero。
NeurIPS 2020论文《基于Gumbel-CRFs的潜在模板诱导》的实现
基于TensorFlow的“Attend,Infer,Repeat”(AIR)模型实现(Eslami等人,2016年,arXiv:1603.08575)。
一些基于感知器 (Perceiver) 神经网络架构的智能体(例如 PPO 和 MuZero),它们可以被训练以在 NetHack/MiniHack 环境中完成目标。
这是 MuZero Unplugged 算法在 PyTorch 环境下的实现,适用于各种 Gym 环境。该算法可以支持各种动作空间和观测空间,包括离散和连续类型。
ICLR 2023 论文“基于学习模型的高效离线策略优化”的代码
【ICLR 2025 大会口头报告】OptionZero:一种在 MuZero 算法中自主发现和利用选项的方法
TACL 2022论文代码:基于变分顺序规划的数据到文本生成
用Python 3 编写的能够执行多种任务的通用人工智能