探索AI前沿,掌握行业发展趋势
每日精选AI热点,追踪最新行业动态
精准筛选产品,多维度产品调研
热门AI产品实力、热度、年/月/日排行
提交AI产品信息,助力产品推广和用户转化
一站式AI工具指南,快速找到你需要的工具
涵盖各类AI模型,满足你的开发与研究需求
热门AI大模型性能、热度、年/月/日排行
寻找优质模型提供商,获取可靠模型支持
多维度对比大模型,找到最适合你的模型
精准计算大模型使用成本,合理规划预算
多模型实时评测,模型输出结果快速比对
聚集热门MCP服务,快速找到适合你的服务
轻松接入MCP客户端,调用强大的AI能力
学习MCP使用技巧,从入门到精通
热门MCP服务性能排行,帮你找到最佳选择
发布你的MCP服务,推广你的MCP服务
自由测试MCP服务,线上快速体验
快速测试MCP服务,快速上线
一站式GEO品牌洞察 提升AI搜索转化率
分析并追踪人工智能模型如何引用您的品牌
检测品牌在AI平台中的可见度
快速评估推广文章在AI 平台的引用情况
通过AI搜索优化服务,让品牌在AI中实现霸屏
一键检测电脑配置,研判运行模型的兼容性
根据算力需求,推荐匹配的服务器配置
发现与 Minigrid 相关的最受欢迎的开源项目和工具,了解最新的开发趋势和创新。
开放式决策AI引擎,最全面的强化学习框架
可以直接用于训练、可视化和评估智能体的强化学习入门文件,无需编写任何代码。
基于JAX加速的元强化学习环境,其灵感来源于XLand和MiniGrid
基于PyTorch的循环多进程深度强化学习Actor-Critic算法A2C和PPO实现
使用大型语言模型进行策略蒸馏,从而训练强化学习智能体的 Python 代码实现(LLM4Teach 方法)
A PyTorch implementation of DIAYN for unsupervised skill discovery in MiniGrid environments. Trains agents to learn diverse behaviors without reward engineering. Features modular architecture and visualization tools.
用强化学习解决游戏问题
学习用于强化学习的视觉嵌入
Sense–Plan–Code–Act (SPCA) framework — LLM+PDDL planning, code generation and ROS2/UR5 simulation for embodied robotic manipulation.
针对MiniGrid 6 Rooms环境的深度强化学习智能体。实现了DQN、双DQN、Huber损失函数、软更新、优先经验回放(PER)和Actor-Critic算法。最佳模型解决了90%的回合,并提高了训练稳定性。
2021-2022学年,计算机科学系,Emanuele Rodolà教授的深度学习与应用人工智能课程项目
个人项目:在Minigrid环境中开发强化学习智能体
implementation of "Knowledge Retention in Continual Model-Based Reinforcement Learning"