发现与 Gumbel Muzero 相关的最受欢迎的开源项目和工具,了解最新的开发趋势和创新。
基于PyTorch的变分自动编码器(VAE)集合
MuZero
【NeurIPS 2023 聚焦论文】LightZero:一个用于通用顺序决策场景中蒙特卡洛树搜索的统一基准(强大的MCTS)
使用语义ID的生成式检索模型(基于论文《具有生成式检索的推荐系统》的PyTorch实现)
MuZero 的 PyTorch 实现
刑天是一个组件化的库,用于开发和验证强化学习算法。
基于PyTorch实现的随机量化变分自编码器(SQ-VAE)
NAACL 2019论文“SEQ^3:用于无监督抽象句子压缩的可微分序列到序列到序列自动编码器”的源代码
MiniZero:一个 AlphaZero 和 MuZero 训练框架
基于 Gumbel Softmax 的 TensorFlow GAN 实现
这是一个使用PyTorch实现的适用于Gym环境的随机MuZero算法。该算法能够支持各种动作空间和观测空间,包括离散和连续类型。
NeurIPS 2020论文《基于Gumbel-CRFs的潜在模板诱导》的实现
一个用 JAX 实现的 MuZero。
基于TensorFlow的“Attend,Infer,Repeat”(AIR)模型实现(Eslami等人,2016年,arXiv:1603.08575)。
一些基于感知器 (Perceiver) 神经网络架构的智能体(例如 PPO 和 MuZero),它们可以被训练以在 NetHack/MiniHack 环境中完成目标。
这是 MuZero Unplugged 算法在 PyTorch 环境下的实现,适用于各种 Gym 环境。该算法可以支持各种动作空间和观测空间,包括离散和连续类型。
ICLR 2023 论文“基于学习模型的高效离线策略优化”的代码
用Python 3 编写的能够执行多种任务的通用人工智能
TACL 2022论文代码:基于变分顺序规划的数据到文本生成
【ICLR 2025 大会口头报告】OptionZero:一种在 MuZero 算法中自主发现和利用选项的方法