碧波液压网 欢迎你,游客。 登录 注册

基于深度强化学习的串联系统屏蔽故障维修策略研究

作者: 樊小波 黄允 谌楚 夏诗雨 来源:机床与液压 日期: 2025-02-25 人气:181
基于深度强化学习的串联系统屏蔽故障维修策略研究
多部件串联系统维修决策优化问题得到越来越多的关注,目前绝大多数相关研究均假设系统失效时其失效部件是可直接观测的。实际的生产运营中,当系统发生失效时,其故障原因往往是屏蔽的,需要采用专业的工具进行诊断才能确定失效部件,继而进行维修。当诊断成本较高且部件接近更换役龄时,可以选择直接更换整个系统而不进行诊断。面向串联系统,考虑其发生屏蔽故障时,可以执行故障诊断确定失效部件继而更换,或者直接更换整个系统,建立半马尔科夫决策模型,以长周期成本率最低为目标函数,决策出每次屏蔽故障时的最佳动作。考虑到多部件导致的状态空间维数灾难问题,采用深度强化学习算法进行求解。最后将模型和算法应用于水电站液压自动抓梁系统,证明了其有效性。

基于DDPG的振动台控制参数整定方法

作者: 纪金豹 黄飞 张文鹏 来源:机床与液压 日期: 2025-02-25 人气:165
基于DDPG的振动台控制参数整定方法
三参量控制是地震模拟振动台的底层控制算法,其参数整定过程中涉及的参数多,传统的参数整定方法存在效率低、过程繁琐等问题。为了提高整定效率和准确性,提出一种基于确定性策略梯度(DDPG)算法的振动台三参量控制参数整定算法。此方法通过将振动台三参量控制系统作为强化学习环境,利用DDPG算法对系统的状态-动作-奖励数据进行学习和训练;训练好的智能体则可以输出最优的控制参数,然后将整定完成的控制参数放在实际振动台系统模型中进行测试。结果表明DDPG算法可以有效优化振动台控制性能,提高试验结果的准确性和可靠性,具有实际应用价值。

基于深度强化学习微小软排线装配技术的研究

作者: 林杰 楚中毅 任芸丹 来源:机床与液压 日期: 2025-02-25 人气:176
基于深度强化学习微小软排线装配技术的研究
传统机器人控制方法仅限于固定种类和较为规则的来料,通过位置关系完成装配。由于排线的形态变异较大,很难实现抓取和自动化组装,排线的组装成功率和良率较低。针对宽度小于2 mm微小排线装配难题,通过机器3D视觉传感、力觉传感、触觉传感和本体觉传感等多模态融合技术,设计一套基于深度强化学习的微小软排线装配智能控制算法。在此基础上搭建了一组由协作机器人、六维力传感器、3D机器视觉系统组成的实验设备,并在多环境、不确定因素下验证了此方法装配的可行性。基于高精度微小排线的装配要求,通过深度强化学习多模态控制方法大幅提升了可靠性和装配的成功率,相比传统控制方法装配效率提升15%以上。此测试系统的装配精度可达±0.1 mm,装配成功率到达98%以上。

基于数字孪生和深度强化学习的矿井超前液压支架自适应抗冲支护方法

作者: 周朗 来源:工矿自动化 日期: 2025-02-25 人气:159
基于数字孪生和深度强化学习的矿井超前液压支架自适应抗冲支护方法
受深部开采冲击地压等地质灾害扰动的影响,存在矿井超前支护系统自感知能力差、智能抗冲自适应能力弱、缺乏决策控制能力等问题。针对上述问题,提出了一种基于数字孪生和深度强化学习的矿井超前液压支架自适应抗冲支护方法。通过多源传感器感知巷道环境和超前液压支架支护状态,在虚拟世界中创建物理实体的数字孪生模型,其中物理模型精确展现超前液压支架的结构特征和细节,控制模型实现超前液压支架的自适应控制,机理模型实现对超前液压支架自适应支护的逻辑描述和机理解释,数据模型存储超前液压支架实体运行数据和孪生数据,仿真模型完成超前液压支架立柱仿真以实现超前液压支架与数字孪生模型虚实交互。根据基于深度Q网络(DQN)的超前液压支架自适应抗冲决策算法,对仿真环境中巷道抗冲支护进行智能决策,并依据决策结果对物理...

基于深度强化学习的AUV路径规划研究

作者: 房鹏程 周焕银 董玫君 来源:机床与液压 日期: 2025-02-25 人气:140
基于深度强化学习的AUV路径规划研究
针对三维海洋环境水下自主航行器(AUV)路径规划问题,传统的路径规划算法在三维空间中搜索时间长,对环境的依赖性强,且环境发生改变时,需要重新规划路径,不满足实时性要求。为了使AUV能够自主学习场景并做出决策,提出一种改进的Dueling DQN算法,更改了传统的网络结构以适应AUV路径规划场景。此外,针对路径规划在三维空间中搜寻目标点困难的问题,在原有的优先经验回放池基础上提出了经验蒸馏回放池,使智能体学习失败经验从而提高模型前期的收敛速度和稳定性。仿真实验结果表明所提出的算法比传统路径规划算法具有更高的实时性,规划路径更短,在收敛速度和稳定性方面都优于标准的DQN算法。

基于深度强化学习的旋转机械故障诊断策略

作者: 龙舰涵 来源:机械设计与制造 日期: 2025-02-10 人气:66
基于深度强化学习的旋转机械故障诊断策略
由于传统深度学习方法无法挖掘原始振动数据与旋转机械状态之间的非线性映射关系,提出了一种基于堆叠式自动编码器与深度Q网络相结合的深度强化学习旋转机械故障诊断方法。首先建立故障诊断“博弈”模型,该博弈模型可以为故障诊断代理提供观察、行动和获得奖励的交互式环境。然后,堆叠式自动编码器采用完全连接模型进行逐级的内在特征学习从而构建了故障诊断代理,然后通过引入记忆回放和迭代更新策略以及奖励反馈机制,使得深度Q网络实现了原始振动信号与故障模式之间的非线性映射关系。最后通过实验证明了提出方法的有效性与可行性。

基于深度强化学习的机械臂避障轨迹规划研究

作者: 曹毅 郭银辉 李磊 朱柏宇 赵治华 来源:机械传动 日期: 2025-01-16 人气:125
基于深度强化学习的机械臂避障轨迹规划研究
针对传统路径规划算法在机械臂避障运动时存在规划时间长、路径冗长等问题,提出了一种基于深度强化学习(Deep Reinforcement Learning,DRL)的运动规划方法。首先,构建了机械臂数学模型和运动环境,并在PyBullet中搭建了DOBOT机械臂与操作环境,设置了DRL所需的奖励函数、动作变量和状态变量等参数。其次,针对静态障碍物规避问题的特点,采用深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)算法,进行了运动仿真试验。仿真结果表明,相较于快速扩展随机树(Rapid-exploring Random Tree,RRT)算法以及改进RRT算法,所提出的DDPG算法在规划时间和路径长度方面均有一定程度提高。最后,在实验室中采用DOBOT机械臂对DDPG算法在多种障碍物环境下避障操作的有效性进行了验证。

基于梯度奖励的深度强化学习移动机器人路径规划

作者: 喻凯旋 林富生 宋志峰 余联庆 来源:机床与液压 日期: 2024-12-18 人气:119
基于梯度奖励的深度强化学习移动机器人路径规划
针对目前深度强化学习移动机器人路径规划中稀疏奖励导致的效率低、收敛慢等问题,提出一种梯度奖励政策。使用区域分割将环境分割为缓冲区、探索区、临近区以及目标区,奖励的动态变化可以逐步缩小机器人的探索范围,同时在安全区域内也能获得正向奖励。首先输入机器人当前的位置坐标,经过神经网络后估计4个动作的Q值,随后通过去首动态贪婪策略达到最大化探索,最后采用基于均方误差的优先经验回放抽取样本进行梯度下降更新网络。实验结果表明:在小范围环境内探索效率可提升近40%,在大范围环境下成功率高于80%,而且在提高探索效率的同时增强了鲁棒性。

基于Dueling Network与RRT的机械臂抓放控制

作者: 王永 李金泽 来源:机床与液压 日期: 2021-08-06 人气:180
基于Dueling Network与RRT的机械臂抓放控制
针对当前机械臂抓取与放置方式固定、指令单一、难以应对复杂未知情况的不足,提出一种基于深度强化学习与RRT的机械臂抓放控制方法。该方法将物件抓取与放置问题视为马尔科夫过程,通过物件视场要素描述以及改进的深度强化学习算法Dueling Network实现对未知物件的自主抓取,经过关键点选取以及RRT算法依据任务需要将物件准确放置于目标位置。实验结果表明:该方法简便有效,机械臂抓取与放置自主灵活,可进一步提升机械臂应对未知物件的自主操控能力,满足对不同物件抓取与放置任务的需求。

定模动辊机电系统动力学智能优化方法

作者: 王鹏远 来源:机床与液压 日期: 2021-07-15 人气:134
定模动辊机电系统动力学智能优化方法
定模动辊成型是一种变截面渐进成型方法,依赖定模动辊成型装备实现高强度金属板材变截面渐进成型。定模动辊成型装备运动平稳性与构件成型质量密切相关,因此以加速度幅值最小为目标函数,考虑定模动辊成型装备伺服电机、传动装置、辊模机构与成型板材的机电系统动力学优化,是机电装备设计理论研究的新课题。采取深度强化学习方法,应用深度确定性策略梯度算法对定模动辊成型装备进行优化。结果表明:该算法适用于机电系统动力学优化,具有科
    共1页/10条