1、哈夫变换检测固定半径圆在人眼定位中的应用 作者: 日期:2 个人收集整理 勿做商业用途 哈夫变换检测固定半径圆在人眼定位中的应用摘要:人眼检测在许多基于眨眼计算和眼睛直径指标控制应用如虹识别、疲劳检测中是必须的阶段。这篇文章提供了一种使用图像处理技术伴随最小的硬件支持来检测图像中眼睛的存在及其位置的方式。预处理含有彩色范围处理和彩色分割。哈夫变换被应用在使用固定半径圆的方式的研究中.发展算法的表现是通过几个方面来评定的,例如人脸的精确识别和人眼定位.关键词:哈夫变换 人眼定位 固定半径 简介经过键盘,鼠标或者其他基于手工的设备,人工和计算机之间的相互作用已经被限制。最近几年,新技术开始在计算机
2、领域中出现,这也使如通过声音和视线跟踪的人工智能交互的其他方式得到提升.基于视线跟踪的几种研究在人工智能或者其它应用类型上已经完成了。这些研究的应用发展表现在很多方面,例如使用视线跟踪来移动鼠标点或者通过键盘打字呈现在电脑屏幕上。在视线跟踪中人眼定位是一件首要的事。在这个工程中,一种算法为了图像中人眼的定位被研究。这个系统能够检测人眼的移动及其移动方向。这个信息当时被用作人类视力习惯的学习数据或使人工智能交互系统的每一个部分成为整体为没有能力的人服务。早在1936年,Mowrer就开始视力研究了,他成功制造出自动的头部眼睛方位的记录及视线跟踪方向。在视力中的研究比其他人工智能交互作用的类型带来
3、更多的利益,因为人眼的移动能够提供许多的信息.眼睛的移动能够作为一种情感的表达方式和残疾人的交流方式.图像中人眼定位技术分为两种类型:介入式和非介入式.介入式要求主题带有一定的设备,像特殊的联系晶片或电子显微镜,它们能够跟踪视线.另一方面,非介入式使主题能够自由带有任何类型的设备.非介入式包括红眼效果、特征检测和神经网络。在这一研究中,基于图像特征检测的非介入式使被关闭的。特征检测技术能够达到人眼定位的效果,因为它不要求主题带有任何设备,特征检测技术主要依靠定位人眼的唯一特征,例如眼睛的环形状。这个技术能够与其他运动检测技术相结合去跟踪人眼的移动及移动方位,这个研究的范围仅限于基于特征检测的人
4、眼定位。 方法学全面的系统被分为3个阶段:视频和图像的获取、图像的预处理及人眼定位.系统的每部分都负责人眼的渐进定位。这个系统是基于来自于一段视频图像框架的输入,从而数码相机捕获视频的能力被需要。这个系统算法及使用者界面是使用MATLAB版本7。04服务包装2被建立的。这个系统的第一阶段是视频和图像的获取,在这一阶段中,一个单独的来自捕获的视频框架被转换成图像框架,而且被储存在记忆中.在第二阶段,图像框架输入到图像预处理部分,这里人脸和人眼所在区域被定位。在预处理阶段使用如YcbCr彩色模型来检测皮肤颜色,制定人脸和人眼四分之一比率的界限及使用MATLAB函数移动不想要的脸部特征,通过使用眼睛
5、区域图像剪裁来自预处理阶段的图像。在最后阶段人眼的位置被确定。这一阶段是通过Sobel或Prewitt边缘检测来完成的,而在人眼定位阶段用的事哈夫变换检测固定半径圆,在这一阶段人眼的中心位置或其他协调位置被获得。在人眼定位阶段提取人眼边缘由于边缘检测算法使用能力不充分可能在许多框架中发生错误。由于视频或者图像的连续被使用,算法将从一个框架到下一个框架继续被使用。在第3阶段的最后来自最近的框架将被保存在计算机记忆中,而且系统将继续处理下一个来自第一阶段的视频框架的初始化.如果最近的框架就是视频的最后一个框架,这是系统将停止,表示视频处理结束。A、边缘检测在图像目标的边沿,边缘检测使用其灰度中断,
6、这个中断在图像中通过使用像素一阶和二阶导数来计算。在一个目标的边缘存在一灰度变化剧烈的地方,如图1所示。边缘的灰度轮廓呈现一个从黑道白的梯度变化,通过计算其一阶导数,一个最高点被定位在过渡的独立点上。二阶导数呈现了来自边缘黑暗边过渡的积极最高点,边缘的消极最高点为白边.一阶导数通常被用于检测边缘的存在,而二阶导数为了检测是否边缘像素在黑或白边。图像的边缘能够被定义为从一个区域到另一个区域灰度变化剧烈的地方。根据变化率图像的梯度函数在那一点有巨大的作用,它能够通过一阶导数根据倾斜度被检测。一个图像的梯度函数f(x,y)被定义为矢量: (1)这个矢量的大小是: (2)它的方向是: (3)如果函数的
7、方向导数沿着任意两个直角都知道,则该图像的梯度能够被计算出来。梯度算法有很多类型,它们之间的主要差别是在这些方向中它们的近似的一阶导数和它们结合这些导数计算的梯度的等级。边缘检测中几个著名的梯度算法是Roberts,Sobel,Prewitt和Canny。输出图像来自另一个边缘检测仅仅包含二元的信息,1表示检测到边缘,0表示无边缘,而且由于噪声,干扰在边缘中,边缘通常得到不完整的形状导致不一致的解释和其他因素而产生假的边缘。二元图像需要更深 的出来来获得有用的信息.B、哈夫变换检测线哈夫变换是一个被用于检测简单形状的技术,例如直线。在一幅nn图像中为了寻找直线,最简单的方法是在图像中计算所有可
8、能在同一直线上的点来定义线,然后找出所有点的特征子集,它们的集合接近一条特殊的线。这个计算量将是巨大的,因为在图像中最大计算量可能是n(n1)/2n和nn(n-1)/2n比较需要每两个点之间执行。使用哈夫变换解决了这个问题,它使用形状的参数描述减少了计算量.两个点(x1,y1)和(x2,y2)在xy轴上被考虑,直线方程式为:yi=axi+b (4)重写为:b=axi+yi (5)这是在xy和ab轴上的两点被描述为如图2所示。第一个点(x1,y1)和第二个点(x2,y2)在ab轴中每一条直线上,而且两条直线相交于点(a,b).这是正确的因为所有的点都包含在这条直线里。使用这个唯一的特征参量空间被
9、称作累加单元或哈夫空间被创建拥有一个小的和大的范围的ab坐标.那时的每个单元都已经被初始化为0。由于在二元图像中的每个单元(边缘检测后的图像)包含1,在ab坐标平面上直线被计算及那直线的部分每个单元增加到1.当在二元图像中包含1的每个像素被算出后,与其它单元比较拥有很多交叉点的单元含有更高的价值。在ab平面中的这些单元的坐标将被用于在xy平面内建立直线。C、固定半径圆检测检测侧直线的方法能够被扩展到圆的检测。在圆的检测中,方程式(5)被圆的方程式所替换为: (6)与直线中只有两个参考数相比元检测方程中含有三个未知参考量,从而,为了三个未知量累加器单元需要从长、宽到长、宽、厚做改变.已知半径r的
10、圆的简单方法被使用在这研究中被作为一种快速的人眼检测方式.使用这个方法,仅仅只有长、宽两个累加单元被需要,因此保持了哈夫变换的简单.在哈夫变换检测直线和检测圆之间其使它们之间保存了相似点。当线检测时,在累加单元里为了生产圆的截取,每次截取累加器单元加1,累加器单元的可能情形如图3所示:在图像中,点(a,b)的价值相当于累加器中的最高点就是检测圆的参考量。 分析结果A、预处理为了定位眼睛,在图像中知道人脸的位置是非常重要的。人脸框架识别的关键原因是显而易见的,因为需要被定位和跟踪的人眼在人脸的某一固定位置,计算机不知道这些,因此必须让电脑知道人脸的位置和眼睛的区域。识别人脸的一种方法是运用彩色分
11、割技术,这种技术的背后思想是实际上脸大部分被皮肤覆盖,而且在图像框架中仅皮肤颜色目标是人脸。在这种技术中,图像被从RGB模型转换为YcbCr模型,这种图形框架的转化如图4所示:在Cb和Cr的色差层皮肤颜色能够被检测.Cb组成部分皮肤颜色价值是图5上的第一个最高点而第二个最高点属于其他的非皮肤对象。另一方面,Cr组成部分组成部分皮肤颜色价值是图6上的第二个最高点而第一个最高点属于其他的非皮肤对象。 使用来自直方图的信息,图像开始技术能够创建一个基于Cb和Cr组成的面罩. 图7显示了那些面罩产生的Cb和Cr的价值及其结果。Cb和Cr两者的面罩被结合会给出一个更好的结果,因为Cb和Cr皮肤颜色的价值
12、之间有一个强壮的关系,这个关系在图8中被说明。接下来的步骤在图像的预处理阶段是的得到脸部区域的坐标。在有用的变窄区域,脸部区域的坐标是关键的,它能够通过基于最终的面罩找出xy轴上的最大和最小坐标被得到。脸部的最大和最小的坐标通过寻找白色像素被得到,并记下最大和最小数检测x-y的作用.结果如图9所示:基于人脸区域的坐标,人眼区域能够被判断通过使用一些简单的计算,在这一判断中,必须确保头部不能移动或加标题与任何一边。从图10可得,人眼区域大概位于人脸区域的第二个四分之一处.通过使用以下公式来估计人眼的区域: (7) (8) (9)图11呈现了从源图像框架获得人眼区域的结果:人眼的ROI的区域尺寸能
13、够被减少移动不想要的脸部特征如眉毛和头发.人脸面罩的算法同样能过被用于人眼区域的面罩。MATLAB函数imclearbord和bwareaopen被用于移动连接图像的边沿和人眼区域中不想要的对象。B、人眼定位哈夫变换仅能被用于边缘检测在人眼上执行后,因此,许多预处理步骤需要被执行在哈夫变换用于检测瞳孔之前.需要做的第一件事是将人眼区域图像从RGB到灰度转换,当人眼图像被转换成灰度图后,边缘检测技术在图像上能够被执行。边缘检测算法的几种类型能够被用于图像,其结果如图12所示。从使用不同的边缘操作得到的结果可看出Sobel和Prewitt边缘操作更适合瞳孔边缘检测的工作且噪声干扰最小.Robets
14、操作不适合,是因为人眼的边缘检测不充分,另一方面,Canny算法产生很多细节,这可能在使用哈夫变换检测圆的下一步造成问题,但是Canny边缘算法的阀值能够被判断得到与Sobel和Prewitt边缘操作过同样的结果。尽管边缘操作成功的提取了瞳孔的边缘,眼脸边缘也被很好的提取,但这可能会造成一个问题,因为它可能是错误的通过做为圆进行哈夫变换,因此为了减少不想要的边缘,在边缘检测图像之前灰度图像上的阀值被执行,这样能提高眼睛边界的检测因为有少的不想要的对象.来自边缘图像的瞳孔检测能够运用哈夫变换检测固定半径圆来完成哈夫变换算法研究仅适合预先半径确定了的圆,瞳孔的尺寸大小决定了圆的半径且预先进行了手工
15、操作.这种算法的结果如图14所示:人眼区域中的人眼的精确定位受眼睛图像边缘精确定位的大影很大,如果有很多不完整的边缘,它们不属于瞳孔,那么哈夫变换算法可能被混淆并产生一个检测错误。检测错误被定义为任何定位人眼的中心不位于人眼的瞳孔区域。在另外一种见识中,如果哈夫变换已经误证一个不是眼睛的对象作为人眼,那么已经发生错误将被告知.图15清楚的突出了成功的人眼定位于错误定位之间的图片。图15呈现的人眼定位错误的发生的主要原因是由于通过哈夫变换算法眼脸的边缘被误证为人眼的边缘。当通过眼脸眼睛被局部的封闭和给了不完整的眼睛边缘时,这个错误通常发生。图15也呈现过了凭借眼睛中心位置的十字准线成功的人眼定位
16、。表1显示了视频V1和视频V2人眼定位的错误率。 通过表1查询了解到V1的平均错误率是9。28,V2的平均错误率是5。94%.使用表1里的数据可以计算出V和V2的平均成功率,V1的平均成功率是90.72%,V2是91。59%. 结论根据非介入式的一种研究图像处理算法已经被实验于人眼定位.这个算法涉及三个阶段:图像获取、预处理和人眼定位。在图像获取阶段捕获视屏并将其转换成图像框架,在于预处理阶段,在图像中YcbCr彩色模型被用于检测皮肤颜色皮肤颜色检测描绘人脸,且其四分之一被用于获得人眼区域,在人眼定位阶段,边缘检测操作被用于创建边缘轮廓图像,从这个图像,哈夫变换检测固定半径圆被用于检测瞳孔。根据以前的部分结果,得出这个系统已经实现了瞳孔检测错误大概在10%左右的一个适当的好的人眼的精确定位。致谢感谢Malaysi Sarawak大学对该研究的大力支持,通过寻找参考NUIMAS/21/0901.2。4(09)向作者表示感谢!
©2010-2024 宁波自信网络信息技术有限公司 版权所有
客服电话:4008-655-100 投诉/维权电话:4009-655-100