带退化效应多态生产系统调度与维护集成优化
为了探索设备退化效应对维护和生产调度耦合关系的影响,对多态单机生产系统调度与预防性维护集成优化进行研究。基于预防性维护费用、工件加工成本以及工件完工回报值,建立了无限阶段平均期望报酬Markov决策模型,并分析和证明了该集成优化模型最优平稳策略的存在性,获得了该模型的最优方程。基于模型最优方程设计了一种无模型强化学习算法用于求解Markov决策模型,可有效解决传统动态规划算法在求解模型时所遭遇的维数灾和模型灾难题。为了评估该无模型强化学习的性能,基于无限阶段平均期望报酬设计了一种启发式求解算法,实验分析结果验证了所引入的无模型强化学习算法的有效性。最后,对该强化学习算法参数进行了敏感性分析,探索各参数对算法性能的影响,为算法设计及其性能提高提供了相应的实验依据。
-
共1页/1条