基于边缘与深度特征的感兴趣区域检测技术
1 引言
感兴趣区域(Region of Interest,简称ROI),就是一幅图像中最能获得观察者注意的那部分区域,亦可称为显著区域。感兴趣区域的检测技术,已经从基于交互的与基于变换的检测技术,逐渐发展为基于视觉特征的检测技术。而Itti等人提出的显著图(SaliencyMap)模型(文献[1]~[4])是较有代表性的基于视觉特征的感兴趣区域检测技术。
Itti等人提出的基于显著图模型的感兴趣区域检测包括特征获取、显著性计算和感兴趣区域的选择与转移三个过程。在特征获取阶段, Itti等人定义了亮度、颜色和方向三种视觉特征,然后形成三种特征的基本特征图,用来区分感兴趣区域与其它区域。在显著性计算阶段, Itti等人采用了对基本特征图进行线性相加的方法来实现特征的融合与显著图的形成。在ROI的选择与转移阶段, Itti等人运用WTA网络选择出ROI,并根据返回抑制机制实现感兴趣区域的转移。本文对Itti等人的方法进行仿真,仿真结果中有67. 5%的检测结果与人的感知结果吻合。本文对Itti等人的基于显著图模型的方法进行分析,发现其存在如下两类问题:
1)与人的视觉感知结果相比较,该方法检测到的ROI出现的位置与ROI大小不准确。
2)该方法可能在ROI转移过程中将目标分离,即在同一目标上检测出多个感兴趣区域,感兴趣区域的转移不准确。
本文通过引进边缘特征、定义新的深度特征来改善第一个问题。根据认知科学的理论,图像在梯度方向上剧烈变化的区域容易引起人的注意,而边缘属于该类区域;另外,视觉对图像中不同区域的感知程度不同,距离观察者越近的区域越容易引起人的注意。因此,本文在Itti等的亮度、颜色和方向三种视觉特征的基础上,引入边缘、深度两个视觉特征,以得到更全面的视觉感知特征,有效解决上述第一类问题。
在对显著图进行二值标注时,本文采用膨胀算法,以此来改善第二个问题。由于同一目标内不同区域的视觉特征可能存在一定的差别,对应的显著图上该目标区域强度不均匀,因此,在ROI的选择与转移阶段,同一目标的不同区域往往被划分为多个检测区域,从而出现ROI在同一目标上进行了多次转移。本文对二值显著图进行膨胀运算,以将同一目标上位置和强度相近的区域进行合并,解决同一目标上的多次ROI转移问题。
Itti与Walther等人定义的三个特征,并没有充分的反映出感兴趣区域与其它区域之间特征的差异性。为此,需要某种特征来更好的表现区域之间的差异性,边缘特征与深度特征能较好的衡量区域之间的差异性。
2.2 显著图计算
显著图可由各尺度上的视觉特征经过如下计算得到:
相关文章
- 2024-07-09基于AD7891的车辆称重采集系统设计
- 2023-10-27瞬时相移干涉测量方法的仿真
- 2022-07-12采用数字温湿度传感器的多点温湿度报警系统设计
- 2023-02-20X射线衍射仪故障与维修实例
- 2022-07-26工控组态软件在煤矿安全生产监测中的应用
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。