毕业设计在Ycbcr空间中的基于肤色的人脸检测.doc

资源描述

1、武汉理工大学毕业设计（论文）基于视频的人脸检测研究学院（系）：机电工程学院专业班级：学生姓名：指导教师：学位论文原创性声明本人郑重声明：所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外，本论文不涉及任何其他个人或集体已经发表或撰写的成果作品。本人完全意识到本声明的法律后果由本人承担。作者署名：年月日学位论文版权使用授权书本学位论文作者完全了解学校有关保障、使用学位论文的规定，批准学校保存并向有关学位论文管理部门或机构送交论文的复印件和电子版，允许论文被查阅和借阅。本人授权省级优秀学士论文评选机构将本学位论文的所有或部分内容编入有关数

2、据进行检索，可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。本学位论文属于1、保密囗，在年解密后合用本授权书2、不保密囗。（请在以上相应方框内打“”）作者署名：年月日导师署名：年月日目录摘要IABSTRACTII1 绪论11.1 课题背景及研究意义11.2 国内外研究发展现状21.3本文的重要内容32 人脸检测技术简介421基于先验知识的方法422基于特性的方法523基于模板匹配的方法624基于记录模型的方法625本文算法方案的提出93 算法设计与MATLAB实现1031常见的颜色空间1032颜色空间地选择1433肤色模型的建立143.4肤色的提取153.5 人脸区域

3、形态学解决1636人脸区域的筛选与标记173.7误检分析224结论及展望24参考文献25致谢26摘要人脸辨认技术属于生物验证的一种，在身份验证领域日益发挥重要作用，具有十分广泛的应用前景。人脸检测和定位问题是人脸辨认技术一方面要解决的问题。人脸检测算法是一个高效的、自动的人脸辨认系统中的关键技术之一。如今人脸检测问题已成为一个热门研究领域，新的算法不断被提出，但是由于人脸的复杂性，目前尚不能找到一个完美的算法。在不同应用环境下，有不同的算法，本文针相应用于视频中人脸检测问题进行了研究，论文的重要工作如下：本文一方面对当下流行的几种人脸检测算法进行分析并比较各自在视频人脸辨认中的合用性。结合其

4、实现难度，提出一个能适应视频人脸辨认的在YCbCr色彩空间中基于肤色的人脸检测算法，由于肤色在YCbCr空间受亮度信息的影响较小，本算法直接考虑YCbCr空间的CbCr分量，映射为两维独立分布的CbCr空间。在CbCr空间下，肤色类聚性好，运用人工阈值法将肤色与非肤色区域分开，形成二值图像。非肤色区域中仍然有也许有部分区域颜色与肤色相近，所以阈值分割后的图像仍然存有部分假肤色区域，通过形态学解决和限制长宽比之后，可得到人脸区域。在拟定人脸区域后，我们需要在原图上对人脸区域进行标记，这里可通过找到一些关键点，作出矩形框标记人脸区域。关键词：YCbCr色彩空间；肤色分割；人脸检测。Abstra

5、ctFace recognition technology is a kind of biological validation, in authentication realm，play an increasingly important role , with a very wide range of applications. Face detection is the first problem to be solved. Face detection algorithm is one of the keys technologies of an efficient, automate

6、d face recognition system . Today, face detection has become a hot research field, new algorithms continue to be made, but because of the complexity of the face, it is not yet found a perfect algorithm. In different application environment, there are different algorithms, this paper studied applies

7、to human face detection video, the papers main work is as follows:This article analyze several current popular face detection algorithm first and then compare their applicability in the face recognition for video. Combined with its implementation difficulty, propose an adaptive face recognition for

8、video in the YCbCr color space, color-based face detection algorithm, as in the YCbCr color space less affected by the brightness information, the proposed algorithm directly consider CbCr component YCbCr space, two-dimensional distribution map of CbCr space independent. In CbCr Space, color cluster

9、ing is good, the use of artificial threshold method to separate the skin and non-skin region, formed a binary image.In non-skin region, there are still some areas may have similar color and skin color, so after thresholding the image still exist some false color region, through morphological process

10、ing and constrain the aspect ratio, the obtained face region.In determining the face region, we need to mark the face region on the original picture, By finding some key points the rectangle labeled human face region could be made.Key words: YCbCr color Space; skin color segmentation; human face det

11、ection.1 绪论1.1 课题背景及研究意义 1.1.1 课题背景自古以来，有关身份验证的研究就一直没有停止过，古代重要通过印章来验证身份，此法沿用至今，到现代，随着计算机和信息技术的发展，人类通过密码、ID卡、IC卡等来验证身份，目前，人们尚有通过人类的生物特性来验证身份，比如说大家熟知的指纹验证、精确度更高的虹膜验证、掌纹验证、人脸辨认（face recognition）验证等，其中，人脸辨认验证是难度最大的。近年来随着人工智能和电子商务迅速发展，人脸辨认技术成为最有潜力的生物辨认技术和人类生物特性验证手段。运用计算机解决人脸图像，从中提取出有效的面部信息并以此来辩识该人的身份的技术

12、，便为人脸辨认技术。相对于其他身份辨认技术，人脸辨认技术具有和谐，使用方便，受限小等优点。人脸辨认技术可以被应用在多种不同的需要身份验证的领域，如金融、证券、公安部门的刑侦等领域。随着网络技术的发展和其日益广泛的应用，信息安全也成为非常重要的一个方面，假如将人脸辨认应用到计算机的登录上，那么相对于密码登录，能更加高效地保证计算机被使用时的安全性。在人脸辨认系统中，对于人脸的检测与定位是人脸能实现有效辨认的先决条件和关键技术，在人脸辨认技术的初期，都是认为人脸是已经得到并已实现定位的假设下进行的，但随着技术的应用日益广泛，此项假设已经不能满足需求，这便提出了人脸检测（face detection

13、）技术。对于人脸检测技术，重要涉及以下几个问题的研究：人脸特性的描述：即如何描述一张人脸的典型特性，比如说相对固定的几何外形，都有眼睛和嘴巴，对于同一人种，肤色大家都差不多，也就是肤色具有类聚的特性，对于不同的特性描述方式，我们就会提出不同的检测方法，可以这样说，选择一个较好的人脸特性描述方式，那我们就会事半功倍，取得较好的效果。尺度：对于不同的人脸照片，人脸的大小会有所不同，在同一张相片中，也也许有大小不一的人脸，这对于在对人脸的大小特性描述是一个比较大的挑战。搜索策略：在描述了人脸特性之后，如何搜索到这些特性点便要用到合适的搜索策略。速度和精度：任何一个实现判断功能的系统，其精度和速度都是

14、十分重要的指标。人脸检测也不例外，在我们选择特性描述和搜索策略时，要在满足精度和速度规定下进行1-2。人脸检测的难点重要有一下几项：(1)如何判断图像中是否存在人脸，如何区别人脸和类似人脸的非人脸图像，这是人脸检测不同于人脸辨认的地方。(2)人脸具有复杂的细节变化，脸形、肤色等特性的个体差异比较明显，即使同一个人也会有不同的表情和姿态等，当侧脸时有面部器官的缺失，这些都使人脸的变化复杂，增长了很大的难度。(3)某些外部物品也许会遮挡人脸，如头发、眼镜、帽子等。(4)由于不同的成像角度会导致人脸的不同姿态，如平面内旋转、深度旋转以及上下旋转，其中深度旋转影响较大。(5)光照的影响，如图像中的亮度

15、、对比度的变化和阴影等。(6)图像的成像条件，如摄像设备的焦距、成像距离、图像获得的途径。由此可见，人脸检测涉及的问题十分广泛，它是一个复杂的具有挑战性的问题。解决此问题具有重要的学术价值，可认为其它类似的复杂模式检测问题提供重要启示，因此人们对人脸检测进行了大量的研究工作。1.1.2课题研究的意义研究人脸辨认在理论和技术上都有重要的意义：一是可以推动对人类视觉系统自身的结识；二是可以满足人工智能应用的需要。采用人脸辨认技术，建立自动人脸辨认系统，用计算机实现对人脸图像的自动辨认有着广阔的应用领域和诱人的应用前景。同时人脸辨认作为一种生物体征辨认与其它较成熟的辨认方法（如指纹、虹膜、DAN检

16、测等）3相比有以下几个优点：无侵犯性，人脸图像的获取不需要被检测人发生身体接触，可以在不惊动被检测人的情况下进行；低成本、易安装，人脸辨认系统只需要采用普通的摄像头、数码摄像机或手机上的嵌入式摄像头等被广泛使用的摄像设备即可，对用户来说也没有特别的安装规定；无人工参与，整个人脸辨认过程不需要用户或被检测人的积极参与，计算机可以根据用户预先的设立自动进行。由于具有以上优点，近几年来，人脸辨认技术引起了越来越多科研人员的关注。人脸检测研究具有重要的学术价值。人脸是一类具有相称复杂的细节变化的自然结构目的,此类目的的检测问题的挑战性在于: 人脸由于外貌、表情、肤色等不同,具有模式的可变性; 一般

17、也许存在眼镜、胡须等附属物; 作为三维物体的人脸的影像不可避免地受由光照产生的阴影的影响；因此,假如可以找到解决这些问题的方法,成功构造出人脸检测与跟踪系统,将为解决其它类似的复杂模式检测问题提供重要的启示。1.2 国内外研究发展现状人脸检测问题是计算机视觉领域中的重要问题，最初作为人脸自动辨认系统的定位环节被提出，近年来由于其在安全访问控制、视觉监测和新一代人机界面等领域的应用价值，开始作为一个独立的课题受到研究者的重视。人脸检测问题在近十年中得到了进一步的研究并取得了长足的发展，国内外的很多学者提出了许多不同的方法，在不同的领域都取得了不同的成果，但是要寻找一种准确率很高的、能普遍合用于

18、各种复杂情况的人脸检测算法，尚有一定的距离。国外的重要研究单位有美国的麻省理工媒体实验室（MIT Media lab）、卡耐基梅隆大学的人机交互学院（Human computer interface institute）、微软研究院的视觉技术研究组（Vision Technology Group）、英国剑桥大学工程系（Department of Engineering）等，国内的微软亚洲研究院、中科院自动化研究所、清华大学、北京工业大学等都有专业人员从事人脸检测的相关研究4。并且，MPEG7标准组织已经建立了人脸辨认草案小组，人脸检测算法也是一项征集的内容。此外，随着人脸检测研究的

19、进一步，国际上发表的有关论文数量也大幅度增长，如IEEE的FG、ICIP、CVPR等重要的国际会议上每年都有大量的关于人脸检测的论文，占有关人脸研究论文的1/3之多细化。其中提出了许多当下流行的算法, Yang和Huang提出了Mosaic方法5；Zabrodshky提出连续对称性检测方法，检测一个圆形区域的对称性，从而拟定是否为人脸6；Riesfield提出广义对称变换方法检测局部对称性强的点来进行人脸器官定位7；卢春雨定义方向对称变换，分别在不同方向上考察对称性，不仅能用来寻找强对称点，并且还可以描述强对称性物体的形状信息，这样的变换对人脸偏转、脸部表情变换、光照等因素都不敏感，使人脸器官

20、定位更为有效8 。国内很多研究机构、大学以及科技公司都对此区域进行了进一步的研究。清华大学、北京工业大学、南京理工大学、四川大学、上海交通大学、中国科学院计算技术研究所和中国科学自动化研究所等都有人员从事人脸检测方面的相关研究。为了促进这项技术的发展，很多知名的国际会议、期刊都设立了人脸检测技术专题，其中涉及CVPR、ICPR、IEEE等，方便研究人员间的技术交流与学习。只但是就目前国内外对人脸检测研究的现状来看，虽然针对人脸检测已经提出了多种算法，也取得了一定的成果。整体来看，人脸检测研究涉及计算机视觉、数字图像解决、人工智能等多个学科领域，同时这项研究还满足了现代计算机网络和通信系统高速发

21、展的需求，无论从实用性还是从学术性来看，均具有很高的研究价值。随着计算机网络的普及，图像、视频等多媒体信息在计算机信息中比重的加大，这一研究必然会得到更快、更长远的发展。1.3本文的重要内容本文重要运用肤色的聚类特性，实现了一个复杂背景下的人脸检测，本文的重要内容为第一章。：第一章介绍了研究本课题的课题背景、学术意义和应用意义，简要介绍了人脸检测的国内外研究和发展现况，并对本文的重要内容作了简要说明。第二章为人脸检测技术简介，通过比较目前比较常用的人脸检测方法，对它们的优劣和实现难度等指标进行评估，提出适合在视频中应用的人脸检测算法，也是本文重要研究的算法-在YCbCr色彩空间中的基于肤色的

22、人脸检测。第三章针对提出的算法进行了算法的实现，并在matlab平台上进行了计算机仿真，对部分仿真结果进行了分析，对算法的应用场合和实用性进行评估。对误检结果进行了分析，并将其作为未来使用中的参考。2 人脸检测技术简介人脸检测是指在输入图像中拟定所有人脸（假如存在）的位置、大小、位姿的过程。人脸检测作为人脸信息解决中的一项关键技术，近年来成为模式辨认与计算机视觉领域内一项受到普遍重视、研究十分活跃的课题。人脸检测问题来源于人脸辨认问题。人脸检测是对给定的图像，判断其中是否有人脸，若有，将所有人脸从背景中分割提取出来，并拟定每个人脸在图像中的位置和大小。人脸检测技术可以应用于人脸辨认、视频会议、

23、图像与视频检索、刑侦破案和证件验证等领域。人脸检测是对于输入的人脸图像或视频，一方面判断其中是否存在人脸，假如存在人脸，则进一步给出每个人脸的位置、大小以及各个重要面部器官的位置信息，并依据这些信息，进一步提取每个人脸中所蕴含的特性，并将其与已知人脸库中的人脸图像进行对比，从而得到辨认结果。由此可见，一个完整的人脸辨认过程应涉及人脸检测与人脸辨认两大部分。人脸辨认由两部分工作组成：(l)人脸检测：在标点符号用中文输入的图像或视频画面当中拟定存在的人脸位置、尺寸等的过程，这是辨认工作的基础课题，在减少算法复杂度等方面对辨认工作有关键性影响。(2)人脸辨认：通过与计算机相连的摄像头动态捕获人的面

24、部信息，并把捕获到的人脸与预先录入的人脸数据库中存储的人脸进行比较辨认。人脸检测的基本思想是建立人脸模型，比较所有也许的待检测区域与人脸模型的匹配限度，从而得到也许存在人脸的区域。本章重要对常用的人脸检测方法进行总结、分析，得出自己的算法依据。近几年，人脸检测技术发展迅猛，研究人员提出很多人脸检测的方法，但是由于人脸检测问题的复杂性，实现通用的人脸检测方法还不实际，因此解决特定约束条件下或某种应用背景下的人脸检测问题仍将是该领域研究的重要课题。对人脸进行检测之前，需要对人脸的特性进行合适的描述，人脸的特性有许多，大体可分为生物特性和外形特性，生物特性有肤色，人类固有的眼、鼻、口等。外形特性有相

25、对固定的长宽比，相对固定的形状，以及面部器官的几何关系等。针对不同的人脸特性描述方式，就可以提出不同的人脸检测方案。从目前来看，人脸检测方法大体可分为以下四类。21基于先验知识的方法这种方法是运用对人脸的先验知识给出检测规则来进行人脸检测。人脸局部特性的分布总是存在着一定的规则，如图像中出现的人脸通常会有几个位置和数量相对固定的面部器官，如鼻子、眼睛、嘴巴等。在一幅人脸图像中，面部的这些特性将一方面被提取出来，然后基于检测规则将候选的脸部区域辨别出来。2.1.1器官分布法格式虽然人脸在外观上变化很大，但五官的空间分布大体符合一些普遍的规律，器官分布法检测人脸即是检测图像中是否存在满足器官分布规

26、则的图像块。这种方法一般有两种思绪：一种思绪是“从上至下”，其中最为简朴有效的是Mosaic方法，它给出了基于人脸区域灰度分布的规则，依据这些规则对图像从粗分辨率到高分辨率进行筛选，以满足这些规则的限度作为检测的判据。这种方法的吸引之处在于使用从粗到细的策略减少了计算量。另一种思绪则是“从下至上”，先直接检测几个器官也许分布的位置，然后将这些位置点分别组合，运用器官分布的几何关系准则进行筛选，找到也许存在的人脸。2.1.2投影法这是一种运用图像的投影快速定位人脸边界和脸部特性的方法。在解决一幅输入图像时，一方面获得其水平投影，然后通过检测其图像的急剧变化处得到两个局部最小值，这两个值相应头部的

27、左右轮廓线。类似地，通过检测垂直投影的局部最小值，检测出人脸的嘴唇、鼻尖和眼睛。这种方法的缺陷在于无法有效检测出有多张人脸的图像以及在复杂背景中的人脸。2.1.3对称法人脸具有一定的轴对称性，各个器官也具有很强的点对称性。连续对称性检测方法，检测一个圆形区域的对称性，从而拟定是否为人脸；广义对称变换方法检测局部对称性强的点来进行人脸器官定位；卢春雨定义方向对称变换，分别在不同方向上考察对称性，不仅能用来寻找强对称点，并且还可以描述强对称性物体的形状信息，这样的变换对人脸偏转、脸部表情变换、光照等因素都不敏感，使人脸器官定位更为有效8。该方法对图像规定很高，并且受姿态、表情、光照等因素的影响较大

28、。其中器官分布法、对称法准确率较高，但运算量大；而投影法虽然准确率不高，但运算量小。22基于特性的方法基于特性的方法试图先找出人脸的稳定特性，再运用其它信息进一步检测人脸。人脸的稳定特性是指在外界环境有所改变时相对不变的特性，比如人的脸部特性、肤色、纹理以及它它们的综合特性等。2.2.1脸部特性一方面我们要提出一些可靠有效的方法来检测脸部特性，然后推断是否有人脸存在。至于人的脸部特性，往往使用边沿检测来获得，如眼睛、眉毛、嘴巴、鼻子等。基于这些特性，我们可以建立起描述特性之间的记录模型，然后去校验是否有人脸存在。当然，这种方法也存在缺陷，此种方法的缺陷在于表情、光照、噪声等因素会导致脸部特性边

29、界弱化，这样就影响到人脸检测结果的准确性。2.2.2纹理特性人脸的纹理特性可以分为三类，即皮肤、毛发和其它类，这些人类特有的纹理可以被用来区别其它物体。这种方法的优点是在对于“不干净”的人脸检测上，如有胡须、眼镜等附属物存在时，检测结果仍然比较准确。2.2.3肤色特性研究表白，人类肤色在去除亮度的色度空间（如YCbCr空间）具有聚类性，颜色信息在一定限度上可以将人脸同大部分背景区分开来，因此可以运用肤色模型有效地检测人脸。运用肤色信息检测人脸的方法具有计算量小，方法相对简朴，易于实时性解决及适合复杂背景下的人脸检测定位等特点。在设计了肤色模型表征人脸颜色之后，运用感光模型进行复杂背景下人脸及器

30、官的检测与分割。该方法对图像规定较高，但运算量小。其最大的优点在于受人脸姿态、表情、光照等因素的影响小。23基于模板匹配的方法基于模板匹配的方法也可以用来检测人脸，一方面设定一些不同标准的、描述人脸的整体特性或局部特性的模板，然后根据模板与图待检测图像的相似度进行匹配检测。2.3.1预定模板匹配法根据人脸的先验知识，我们可以制作出描述人脸轮廓特性的模板，通过计算图像区域和人脸轮廓模板的相关性参数可检测出候选人脸区域，然后运用器官特性子模板筛选上一步检测出的候选人脸区域。在初期研究人员使用了眼睛、鼻子、嘴巴、脸部轮廓的子模板建立起人脸模型。Craw等人一方面使用一个Sobel滤波器来提取边沿，然

31、后将这些边沿集合起来搜索基于几个约束条件的人脸模板。92.3.2变形模板法其重要思想是定义一个具有参数的可变模板和一个能量函数来描述人脸特性，通过一个非线性最优化方法求出各个模板相应的能量函数。能使能量函数最小的参数模板即被认为是所求特性的描述。此方法充足考虑到人脸是变形体的特点，稳定可靠，且与姿态和光照无关，但仍然存在难以适应一般情况和计算量巨大的问题。并且该方法必须是在待检测的人脸附近，变形模板必须被初始化。2.3.3动态轮廓法又称Snakes模型法。Kass等人提出在不需要更多先验知识或高层解决结果指导的情况下实现自追迹以得到目的的闭合、光滑、连续的轮廓线，该方法具有较强的抗噪能力10。

32、Snakes模型通过对一条初始给定的连续闭合曲线计算初始能量函数，然后通过变分方法求取能量函数的最小化，以得到人脸的轮廓曲线11。该方法对图像规定高，运算量大，并且受姿态、表情、光照等因素的影响大，但其优点是准确率高。24基于记录模型的方法由于人脸图像的复杂性，一般地描述人脸特性具有一定困难，因此另一类方法，即基于记录模型的方法越来越受到重视。此方法将人脸区域看作一类模式，即模板特性，使用大量的“人脸”与“非人脸”样本训练、构造分类器，通过度类器对图像中所有也许区域进行“人脸”与“非人脸”的划分。事实上此方法将人脸检测问题转化为记录模式辨认的二分类问题，即判断区域是否为人脸。记录辨认方法可分为

33、四大类：基于特性空间的格式方法、基于人工神经网络的方法、基于概率模型的方法和基于支撑向量机的方法。241基于特性空间的方法此类方法将人脸区域图像变换到某一特性空间，根据其在特性空间中的分布规律划分为“人脸”与“非入脸”两类模式。特性脸方法是一种常用的方法。它根据图像的记录特性进行正交变换(K-L变换)，以消除原有向量各个分量问的相关性。变换得到相应特性值依次递减的特性向量。人脸在特性脸空间的投影聚集比较紧密因此运用前若干张特性脸将人脸向量投影到主元子空间F和与其正交的补空间F，相应的距离度量分别称为DIFS(Distance In Feature Space)和DFFS(Distance Fr

34、om Feature Space)。对于人脸检测问题，由于没有考虑“非人脸”样本的分布，需要同时使用DIFS和DFFS才干取得较好的效果。Sung等人将样本经预解决后按行列顺序展开为样本向量进行主分量分解。采用均值聚类方法在特性空间中建立6个“人脸”（CluSterS)，同时建立包围“人脸”簇的6个“非人脸”簇，以使“人脸”与“非人脸”模式的边界更为清楚。并使用“自举”(bootstrap)方法加以解决了非人脸样本选区的问题：一方面建立一个仅使用“人脸”簇的初始分类器对一组图像进行检测，将所有的错误报警(不是人脸而被错检为“人脸”的结果)加入“非人脸”样本库，构造新的使用“人脸”与“非人脸”簇

35、的分类器重新检测。以上过程不断迭代，直到收集了足够的“非人脸”样本。属于特性空间方法的尚有因子分解方法(Factor Analysis)和Fisher准则方法。Yang等在混合线性子空间(mixtures oflinear subspaces)中对“人脸”和“非人脸”样本的分布进行建模，分别使用基于EM算法的扩展FA方法和基于自组织映射的FLD方法构造检测器。242基于神经网络的方法人工神经网(ANN)方法是把模式的记录特性隐含在ANN的结构和参数之中，对于人脸这类复杂的、难以显式描述的模式，基于ANN的方法具有独特的优势。CMU的Rowley等使用了多个ANN检测多姿态的人脸，算法显示了两类

36、ANN：1个位姿检测器(poseestimator)用于估计输入窗口中人脸的位姿、3个检测器(detector)分别检测正面(frontal)、半侧面(half-profile)和侧面(profile)的人脸。使用通过对准和预解决的“人脸”样本以及采用“自举”(bootstrap)方法收集分类器错分的样本作为“非人脸”样本训练各个ANN，进一步修正分类器。检测时对输入图像中所有也许位置和尺度的区域一方面使用位姿检测器估计人脸位姿，经校准和预解决后送入3个检测器中，最后对检测器的分类结果进行仲裁。Rowley等对正面端正人脸和正面旋转人脸的检测单独进行了研究。对于正面端正的人脸，仅使用了正面入脸

37、检测ANN，是一种三层前向网：输入层相应2020像素的图像区域；隐层节点分为相应不同人脸区域的若干组，与输入层部分连接；ANN输出1到1区间的值表达这个区域是否为人脸。Rowley等使用相同的“人脸”样本和不同“自举”过程收集的“非人脸”样本训练了多个正面人脸检测ANN，对它们的检测结果进行仲裁，以进一步减少错误报警。对于正面旋转人脸的检测使用了旋转角度检测器及正面人脸检测ANN，并使用相似的多ANN仲裁方法减少错误报警。基于人工神经网的方法尚有Jue等和Kouzani等提出的基于人脸器官检测的多级网络方法、Anifantis等提出的双输出人工神经网的检测算法等。神经网络方法在人脸检测与辨认上

38、比其它类型的方法有其独到的优势，即它避免了复杂的特性提取工作，可以通过学习的过程获得其它方法难以实现的关于人脸辨认的规律和规则的隐性表达。243基于支持向量机的方法支持向量机法是在记录学习理论的基础上发展出一种新的模式辨认方法，它是基于结构风险最小化原理的方法，较之于基于经验风险最小化的人工神经网络，一些难以逾越的问题，如：模型选择和过学习问题、非线性和维数劫难问题、局部极小点问题等都得到了很大限度上的解决。但是直接使用SVM方法进行人脸检测有两个方面的困难：训练SVM需规定解二次规划问题，计算复杂度高，内存需求量巨大；在非人脸样本不受限制时，需要极大规模的训练集合，得到的支持矢量会很多，使得

39、分类器的计算量过高。Platt提出的SMO算法有效地解决了第一个问题。Osuna等人一方面将SVM方法用于人脸检测问题，在训练中使用了大量人脸样本，采用“自举”的方法收集“非人脸”样本，并使用逼近优化的方法减少支持矢量的数量，在一定限度上解决了第二个问题；梁路宏等采用模板匹配与SVM方法相结合的人脸检测算法，在模板匹配限定的子空间内采用自举的方法收集“非人脸样本”，训练SVM，减少了训练的难度和最终得到的支持矢量的规模，使得检测速度比单纯的SVM检测器提高了20倍，得到了与CMU的神经网络方法可比较的结果。12Richman等提出用人脸中的鼻子区域训练SVM，减少了训练数据，且不用考虑SVM对

40、发型、眼镜等饰物敏感，采集图像时也不规定人脸必须定位。该方法为柯达公司设计出了针对顾客图像的实用人脸检测系统。244基于概率模型的方法基于概率模型的一种思绪是运用贝叶斯原理计算输入图像区域属于人脸区域的后验概率。CMU的Schneiderman等提出一种基于后验概率的检侧方法。将难以估计的先验概率P(object)用一个比率参数入代替，作为调节检测器敏感度的参量。在学习过程中得到“人脸”和“非人脸”两种模式的概率分布。通过对敏感度的调节，达成检测的效果。另一种应用较多的概率模型是用于描述信号记录特性的隐马尔可夫模型(Hidden Markov Models，HMM)，目前也被应用于人脸检测与辨

41、认。Nefian根据正面人脸由上到下各个区域(头发、额头、双眼、鼻子、嘴)具有自然不变的顺序这一事实，使用一个包含五个状态的一维连续HMM加以表达。将头部图像按照这五个区域划分为互有重叠的条块，对各块进行KL变换，选取前若干个变换系数作为观测向量训练HMM。11Nefian还提出了基于嵌入式HM 的人脸检测方法。该方法同时考虑到人脸由左到有各个特性的自然顺序，使用了二维HMM，并且采用二维DCT变换的系数作为观测向量。此外尚有Meng使用HMM描述人脸的小波特性中不同级间的相关性等方法。基于HMM的方法一般只使用“人脸”样本进行训练，重要针对用于人脸辨认的头肩部图像。该算法对图像规定较低，受姿

42、态、表情、光照等因素的影响较小，辨认率高，但运算量相称大。25本文算法方案的提出在四类常见的人脸检测算法中，使用场合各异，优势和劣势并存，在视频的人脸检测中，没有完美的算法，但是综合这几种算法，可以提出一个适合于视频应用的算法。基于先验知识的算法由于对人脸的姿态和背景有规定，如器官分布法对背景有一定规定，且对非正脸的检测效果不好，投影法对背景规定较高，对称法运算量大，且对非正脸的检测效果也不好。基于特性的算法中重要分为基于肤色、基于脸部特性和基于纹理，基于肤色具有简朴，快速的优点，且对脸的姿态规定不高，基于纹理的算法规定图像能反映毛发等信息，对图像的规定较高。基于脸部特性的算法对脸的姿态有规定

43、。对于模板的人脸检测方法，计算量大，速度比较慢。在视频应用中若计算机运算速度不够快的话，实时性较差。对于记录模型的人脸检测，优点在于将人脸检测问题化成了二分类问题，难点在于分类器的构造，分类器的优劣直接影响到了算法的优劣，在视频中，图像块变化繁复，这对于构造一个高效高速的分类器来说是一个不小的挑战。总的来说，基于肤色的人脸检测由于其简朴快速、适应性较广、对图像质量规定不高，适合在视频中用于快速人脸检测，并且在YCbCr空间中肤色的类聚性较好，加强了其抗干扰的能力，因此本文选择在YCbCr空间中基于肤色的人脸检测。此算法一方面要将图像转换到YCbCr空间中，提取Cb和Cr分量之后，运用人工阈值法

44、二值化，提取肤色，然后进行形态学解决；对候选区进行限定长宽比，筛选出人脸，最后在原图上画框标记人脸。3 算法设计与matlab实现对于复杂背景的彩色图像，肤色是人体表面最为显著的特性之一，是人脸的重要信息，不依赖于面部的细节特性，对于旋转、表情的变化等情况都能合用，具有较高的稳定性，并且计算机能将肤色与大多数背景物体的颜色相区别。因此肤色特性在人脸检测中是最常用的一种特性。肤色特性重要由肤色模型描述，基于肤色的人脸检测方法通常分为颜色空间的选择、肤色区域分割和人脸检测三大步。在拟定肤色模型之后，一方面可以进行肤色检测，在检测出肤色像素后，需要根据它们在色度空间内的相似性和位置上的相关性分割出也

45、许的人脸区域，同时运用区域的几何特性或是灰度特性进行是否是人脸的验证，以排除其它色彩类似肤色的物体，区域分割与验证在很多方法中是密切结合统一考虑的。通常为了消除光照对人脸肤色的影响，在肤色区域分割前会对图像进行光照校正，以消除色彩偏移。在提取肤色之前，对人脸图像的预解决必不可少，这其中涉及图像的噪声滤除，图片的亮度平衡等；图像的噪声解决可用图像平滑来实现。图像平滑是指用于突出图像的宽敞区域、低频成分、主干部分或克制图像噪声和干扰高频成分，使图像亮度平缓渐变，减小突变梯度，改善图像质量的图像解决方法。对于图像的亮度，若要一张图像实现亮度平衡，可通过均衡RGB三个分量的直方图来实现，但是，对于人脸

46、检测，我们可以抛开亮度信息，即将图像转化到YCbCr空间。 31常见的颜色空间光在频谱分布中的不同位置体现了各种颜色，颜色是人对光谱中可见光的感知结果。根据光度学和色度学原理，所有颜色都可以用互相独立的三种基本颜色混合得到，这三种颜色被称为三基色，由此就构成了色彩空间。著名的格拉曼定律反映了视觉对颜色的反映取决于红、绿、蓝三种颜色在输入量中的代数和之一事实。格拉曼定律涉及如下四个方面的内容：(1)所有颜色都可以用互相独立的三基色混合而得到；(2)假如三基色的混合比相等，则色调和色饱和度也相等；(3)任意两种颜色相混合产生的新颜色与采用三基色分别合成这两种颜色的各自成份再混合起来得到的结果相同；

47、(4)混合色的光亮度是本来各分量光亮度的总和；这里色调、色饱和度、亮度是表达色觉限度的。色调表达各种颜色，色饱和度表达颜色深浅。以三基色为基础的格拉曼定律可以用式3-1来表达： (3-1)根据计算机色彩理论，对于同一种颜色而言，在计算机中有不同的表达方式，这样就形成了各种不同的色彩空间。每一种色彩空间都有其各自的产生背景及应用领域。数字图像中的一个象素点的颜色可以有很多种方法来表达，其中最直接的表达方法是我们所熟知的由红、绿、蓝三基色构成的色彩空间。下面我们具体介绍一些常用于肤色提取的色彩空间，通过比较肤色在各颜色空间的聚类效果的好坏来选择合适的颜色空间。3.1.1 RGB色彩空间RGB色彩空间也称为红、绿、蓝基色模型。为标准化起见，CEI(国际照明委员会)在年选择红色(波长i=700nm)，绿色(波长z=546nm)，蓝色(波长z=435nm)三种单色光作为表色系统得三基色，这就是色彩空间，它也是最常见的色彩空间。由于彩色图像是多光谱图像的一种特殊情况，相应于人类视觉的三基色，即红、绿、蓝三个波段，是对人眼的光谱量化性质的近似 13。因此，运用R、G、B三基色这三个分量来表征颜色是很自然的一种格式。并且多数的图像采集设备都直接感知色彩的三个分量，这也使得模型成为图像成像、显示、打印等设备的基础，具有十分重要的作用。在色彩空间中，每一个数字图像

展开阅读全文