探索AI前沿,掌握行业发展趋势
每日精选AI热点,追踪最新行业动态
精准筛选产品,多维度产品调研
热门AI产品实力、热度、年/月/日排行
提交AI产品信息,助力产品推广和用户转化
一站式AI工具指南,快速找到你需要的工具
涵盖各类AI模型,满足你的开发与研究需求
热门AI大模型性能、热度、年/月/日排行
寻找优质模型提供商,获取可靠模型支持
提交模型信息和服务,精准推广和触达用户
多维度对比大模型,找到最适合你的模型
精准计算大模型使用成本,合理规划预算
多模型实时评测,模型输出结果快速比对
聚集热门MCP服务,快速找到适合你的服务
轻松接入MCP客户端,调用强大的AI能力
学习MCP使用技巧,从入门到精通
热门MCP服务性能排行,帮你找到最佳选择
发布你的MCP服务,推广你的MCP服务
自由测试MCP服务,线上快速体验
快速测试MCP服务,快速上线
通过AI搜索优化服务,让品牌在AI中实现霸屏
检测品牌在AI平台中的可见度
一键检测电脑配置,研判运行模型的兼容性
提供用于训练、评估和测试模型的数据集
提供各类文档文字提取,支持自定义场景
发现与 Gumbel Muzero 相关的最受欢迎的开源项目和工具,了解最新的开发趋势和创新。
基于PyTorch的变分自动编码器(VAE)集合
MuZero
【NeurIPS 2023 聚焦论文】LightZero:一个用于通用顺序决策场景中蒙特卡洛树搜索的统一基准(强大的MCTS)
使用语义ID的生成式检索模型(基于论文《具有生成式检索的推荐系统》的PyTorch实现)
MuZero 的 PyTorch 实现
刑天是一个组件化的库,用于开发和验证强化学习算法。
基于PyTorch实现的随机量化变分自编码器(SQ-VAE)
NAACL 2019论文“SEQ^3:用于无监督抽象句子压缩的可微分序列到序列到序列自动编码器”的源代码
MiniZero:一个 AlphaZero 和 MuZero 训练框架
基于 Gumbel Softmax 的 TensorFlow GAN 实现
这是一个使用PyTorch实现的适用于Gym环境的随机MuZero算法。该算法能够支持各种动作空间和观测空间,包括离散和连续类型。
一个用 JAX 实现的 MuZero。
NeurIPS 2020论文《基于Gumbel-CRFs的潜在模板诱导》的实现
基于TensorFlow的“Attend,Infer,Repeat”(AIR)模型实现(Eslami等人,2016年,arXiv:1603.08575)。
一些基于感知器 (Perceiver) 神经网络架构的智能体(例如 PPO 和 MuZero),它们可以被训练以在 NetHack/MiniHack 环境中完成目标。
这是 MuZero Unplugged 算法在 PyTorch 环境下的实现,适用于各种 Gym 环境。该算法可以支持各种动作空间和观测空间,包括离散和连续类型。
ICLR 2023 论文“基于学习模型的高效离线策略优化”的代码
【ICLR 2025 大会口头报告】OptionZero:一种在 MuZero 算法中自主发现和利用选项的方法
TACL 2022论文代码:基于变分顺序规划的数据到文本生成
用Python 3 编写的能够执行多种任务的通用人工智能