Contorl-CSTR-using-Reinforcement-learning
Public本研究探讨了使用强化学习 (RL) 控制连续搅拌釜反应器 (CSTR),并评估了其相对于传统控制器(PID、模型预测控制 MPC)的有效性。强化学习通过学习最优行为以最大化奖励,在探索能力和更低的计算负载方面优于非线性模型预测控制 (NMPC)。
创建时间:2023-09-14T01:35:34
更新时间:2025-07-30T02:50:46
14
Stars
0
Stars Increase
本研究探讨了使用强化学习 (RL) 控制连续搅拌釜反应器 (CSTR),并评估了其相对于传统控制器(PID、模型预测控制 MPC)的有效性。强化学习通过学习最优行为以最大化奖励,在探索能力和更低的计算负载方面优于非线性模型预测控制 (NMPC)。