眼睛特征提取中可变形模板能量函数优化方法
眼睛轮廓的提取在许多应用中,如视觉理解、人脸识别[1]、智能编码系统和人机交互界面[2]等,占有重要的地位.在人脸识别和视觉理解中[1],很多方法都是利用人脸特征的几何模型,根据这些模型的相对位置以及形状等特征进行识别或解释.在人机交互界面的设计中,通常先提取出一些重要的人脸特征,包括眼睛轮廓,然后在后面的序列中对这些特征进行跟踪[2-3].
由Yuille等[4]首先提出的可变形模板是一个描述眼睛轮廓的很有效的模型.由于它利用了图像的全局信息,因而提高了定位特征轮廓的可靠性.然而,该模板还存在很多的问题,如收敛速度慢、对初始值敏感、虹膜收缩、陷入局部极值和提取精度不够等.为了提高收敛速度,避免陷入局部极值,研究者们除了提出新的能量函数,使能量函数能够更为精确地表示眼睛的特征外,还对可变形模板的能量函数优化问题进行了大量的研究[5-9].为了改进可变形模板提取眼睛轮廓特征的性能,研究者们针对其中的优化过程提出了很多的方法,这些方法主要区别在于其优化的步骤和迭代的方法上.在Yuille等提出的优化方法中,将整个优化过程分为调整虹膜、调整外轮廓和整体微调3个阶段,每个阶段再分为若干子步骤,一共是8个子步骤;Xie等[5]提出了一步优化的方法; Lam等[6]则将这3个阶段分为5个子步骤对能量函数进行优化;Shan等[8]提出分虹膜调整、上眼帘轮廓调整和下眼帘轮廓调整3个阶段的优化方法.对这些优化方法进行深入分析,发现优化过程中优化步骤过多或过少,都容易出现问题.因此,需要根据实际的问题设计合适的优化过程,提高眼睛轮廓特征提取的性能.
作者提出了一种新的能量函数优化过程,以缓解陷入局部极值的问题.考虑到一些能量函数项,如角点能量项的局部特性,提出了将能量函数的优化过程分解为3个步骤进行.在眼睛图像上对提出的方法进行了实验.实验结果表明,作者提出的方法在眼睛轮廓定位精度和时间复杂度上取得了较好的折衷.
1 可变形模板与能量函数
1·1 眼睛轮廓几何模型
采用了如图1所示的几何模型表示眼睛轮廓.分别用一个圆和两条抛物线来表示虹膜的轮廓和上下眼帘的轮廓.这样,模型可以用矢量(Xc,Xe,r,a,b,c,θ)表示.其中:Xc为虹膜的中心;Xe为眼睛的中心;r为虹膜半径;b为抛物线的长度;a和c分别为上下抛物线的高度;θ为眼睛(抛物线)的旋转角度;P1和P2为眼睛左右眼角点;P3~P6为虹膜(圆)和眼帘(抛物线)的交点.根据不同的参数,虹膜与眼帘的交点个数也不相同.图1所示的这4个交点也同时描述了眼睛轮廓的特点.
1·2 能量函数
作者采用文献[9-10]中所定义的能量函数.与大多数以前方法中的能量函数不同的是,该能量函数引入了角点能量项来表征眼睛轮廓中的角点信息.角点能量项定义为
相关文章
- 2024-08-15浅谈风机机座上两轴承孔同轴度偏差过大的修正
- 2023-10-30智能化仪器监控程序的结构设计
- 2024-08-28多功能形位误差测量系统的研制与应用
- 2024-05-21再谈智能高速在线涡流探伤系统的研发
- 2023-11-03MSP430单片机在新型智能水表开发中的应用
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。