区域分割_碧波液压网- Powered by Kangli Wu!

基于梯度奖励的深度强化学习移动机器人路径规划

作者：喻凯旋林富生宋志峰余联庆来源：机床与液压日期： 2024-04-25 人气：118

针对目前深度强化学习移动机器人路径规划中稀疏奖励导致的效率低、收敛慢等问题,提出一种梯度奖励政策。使用区域分割将环境分割为缓冲区、探索区、临近区以及目标区,奖励的动态变化可以逐步缩小机器人的探索范围,同时在安全区域内也能获得正向奖励。首先输入机器人当前的位置坐标,经过神经网络后估计4个动作的Q值,随后通过去首动态贪婪策略达到最大化探索,最后采用基于均方误差的优先经验回放抽取样本进行梯度下降更新网络。实验结果表明:在小范围环境内探索效率可提升近40%,在大范围环境下成功率高于80%,而且在提高探索效率的同时增强了鲁棒性。

关键词：深度强化学习路径规划梯度奖励区域分割去首动态贪婪策略点击下载

X-射线分层成像中灰度重建的研究

作者：邹小庆王经瑾来源：核电子学与探测技术日期： 2023-03-01 人气：1

利用边缘提取和立体匹配技术可以对X-射线立体透视图像进行分层成像，但分层后得到的物体图像仅仅是边缘图像，研究了一种利用原始的灰度图像对分层后的边缘图像进行灰度重建的方法，使得每一层的图像的接近实际的灰度图像。

关键词： X-射线透视灰度重建分层成像图像处理区域分割灰度还原点击阅读

共1页/2条