分阶Dyna强化学习算法
针对现有Dyna强化学习体系结构下,“规划”和“学习”在计算资源分配上的不合理问题,提出了一种分阶Dyna体系结构,随着经验知识的不断积累,将学习过程划分为探索阶段、变比重学习阶段和优化阶段,分别进行“规划”和“学习”的协调控制,大大减少了计算资源的浪费。结合传统的Q-学习算法,设计了分阶Dyna—Q强化学习算法,以适应动态不确定环境下的任务。在一个标准强化学习问题中,验证了所设计的分阶Dyna强化学习算法比基本Dyna强化学习算法具有更好的学习性能。
直角坐标机器人迭代滑模交叉耦合控制器设计
为克服机械惯性、负载扰动以及复杂的轮廓误差模型等因素对三轴直角坐标机器人末端执行器位姿精度的影响,设计了一种迭代滑模交叉耦合控制器。其中:滑模速度控制器用以抑制非周期干扰;迭代学习位置控制器用以减小跟踪误差;轴间变增益交叉耦合控制器用以消除轮廓误差。通过仿真验证了上述复合控制器的性能。结果表明,所设计的迭代滑模交叉耦合控制器具有较高的轮廓精度和较强的鲁棒性。
-
共1页/2条