1、成都理工大学2014届学士学位论文(设计)基于2DPCA的人脸识别算法研究摘 要人脸识别技术是对图像和视频中的人脸进行检测和定位的一门模式识别技术,包含位置、大小、个数和形态等人脸图像的所有信息。由于近年来计算机技术的飞速发展,为人脸识别技术的广泛应用提供了可能,所以图像处理技术被广泛应用了各种领域。该技术具有广阔的前景,如今已有大量的研究人员专注于人脸识别技术的开发。本文的主要工作内容如下:1) 介绍了人脸识别技术的基础知识,包括该技术的应用、背景、研究方向以及目前研究该技术的困难,并对人脸识别系统的运行过程以及运行平台作了简单的介绍。2) 预处理工作是在原始0RL人脸库上进行的。在图像的预
2、处理阶段,经过了图象的颜色处理,图像的几何归一化,图像的均衡化和图象的灰度归一化四个过程。所有人脸图像通过上述处理后,就可以在一定程度上减小光照、背景等一些外在因素的不利影响。3) 介绍了目前主流的一些人脸检测算法,本文采用并详细叙述了Adaboost人脸检测算法。Adaboost算法首先需要创建人脸图像的训练样本,再通过对样本的训练,得到的级联分类器就可以对人脸进行检测。4) 本文介绍了基于PCA算法的人脸特征点提取,并在PCA算法的基础上应用了改进型的2DPCA算法,对两者的性能进行了对比,得出后者的准确度和实时性均大于前者,最后将Adaboost人脸检测算法和2DPCA算法结合,不仅能大
3、幅度降低识别时间,而且还相互补充,有效的提高了识别率。关键词:人脸识别 2DPCA 特征提取 人脸检测2DPCA Face Recognition Algorithm Based on The ResearchAbstract:Face recognition is a technology to detect and locate human face in an image or video streams,Including location, size, shape, number and other information of human face in an image or v
4、ideo streams.Due to the rapid development of computer operation speed makes the image processing technology has been widely applied in many fields in recent years. This papers work has the following several aspects:1)Explained the background, research scope and method of face recognition,and introdu
5、ced the theoretical method of face recognition field in general.2)The pretreatments work is based on the original ORL face database. In the image preprocessing stage, there are the color of the image processing, image geometric normalization, image equalization and image gray scale normalization fou
6、r parts. After united processing, the face image is standard, which can eliminate the adverse effects of some external factors.3)All kinds of face detection algorithm is introduced, and detailed describing the Adaboost algorithm for face detection. Through the Adaboost algorithm to create a training
7、 sample,then Training the samples of face image,and obtaining the cascade classifier to detect human face.4)This paper introduces the facial feature points extraction based on PCA ,and 2DPCA is used on the basis of the PCA as a improved algorithm.Performance is compared between the two, it is conclu
8、ds that the real time and accuracy of the latter is greater than the former.Finally the Adaboost face detection algorithm and 2DPCA are combined, which not only can greatly reduce the recognition time, but also complement each other, effectively improve the recognition rate.Key words:Face recognitio
9、n 2DPCA Feature extraction Face detection 目 录第1章 前 言11.1 人脸识别的应用和研究背景11.2 人脸识别技术的研究方向21.3 研究的现状与存在的困难31.4 本文大概安排4第2章 人脸识别系统及软件平台的配置42.1 人脸识别系统概况42.1.1 获取人脸图像信息52.1.2 检测定位52.1.3 图像的预处理52.1.4 特征提取62.1.5 图像的匹配与识别62.2 OpenCV62.2.1 OpenCV简介62.2.2 OpenCV的系统配置72.3 Matlab与图像处理8第3章 图像的检测定位83.1 引言83.2 人脸检测的方法
10、83.3 Adaboost算法93.3.1 Haar特征103.3.2 积分图103.3.4 级联分类器11第4章 图像的预处理134.1 引言134.2 人脸图像库134.3 人脸预处理算法144.3.1 颜色处理144.3.2几何归一化154.3.3直方图均衡化164.3.4灰度归一化184.4 本章小结19第5章 图像的特征提取与识别195.1 引言195.2 图像特征提取方法205.2.1基于几何特征的方法205.2.2基于统计的方法205.2.3弹性图匹配(elastic graph matching)215.2.4神经网络方法215.2.5支持向量机(SVM)方法225.3 距离分
11、类器的选择225.4 PCA算法的人脸识别245.5 二维主成分分析(2DPCA)255.5.1 2DPCA人脸识别算法255.5.2 特征提取275.5.3 分类方法275.5.4 基于2DPCA的图像重构285.6 实验分析28第6章 总结与展望336.1 本文总结336.2 未来工作展望33致谢34参考文献:35第1章 前 言1.1 人脸识别的应用和研究背景 随着社会科学技术的发展进步,特别是最近几年计算机的软硬件技术高速发展,以及人们越来越将视野集中到快速高效的智能身份识别,使生物识别技术在科学研究中取得了重大的进步和发展。由于生物之间的生物特征具有很好的自身稳定性以及个体差异性,因此
12、身份识别就是利用生物体内在的属性也就是生物特征作为依据1 刘丽华.自动人脸识别方法研究与展望.内江科技,2005,5:5758。当然人脸上的所具有的特征也是特别有用的生物特征,因为人脸特征具有被动识别、易于用户接受和方便友好等特点,被广泛用来进行身份的识别和验证等领域2 周杰,卢春雨,张长水,李衍达.人脸自动识别方法综述电子学报,2000年第4期.。对于人类而言,对其他个体进行识别是件非常容易的事情,人脸识别属于我们一种无意识的本能行为。但是对于计算机而言,要想对人脸进行检测并识别出具体的目标却具有非常大的难度。人脸识别涉及了多个领域的相关知识,包括图像处理、模式识别、心理学、认知学、生理学等
13、。与人的指纹和虹膜等特征类似,每个人都有唯一的一张脸,因此就像身份证一样用来识别人们的身份。早在1888年就已经提出了人脸识别的概念3 RGaltonPersonal identification and description.Nature,June 21,1888,173-177.,可是直到20世纪80年代末,人脸识别技术才成为人们研究的热点。而现在该技术已经取得了重大的突破,可谓百家争鸣,很多研究机构都已提出了自己的人脸识别算法。目前,部分人脸识别技术已经应用于产品中,给人们生活带来了极大的便利。同其它生物特征识别技术相比,如指纹识别,语音识别,虹膜识别,DNA识别和步态识别等,它具有被
14、动、友好和方便的优点。其应用范围非常广泛,可应用于下面的几个应用4 Chellappa R Wilson C k Sirohey SHuman and machine recognition of faces:a surveyProcIEEE,1995,83(5):705-740:嫌疑犯照片的识别匹配信用卡、护照、个人身份和驾驶执照的识别商场、银行安全系统公众场合的监控计算机登录、门禁系统控制专家身份识别系统基于目击者的人脸重构嫌疑犯的电子照片簿基于残留人脸的人脸重构基于父母人脸的小孩脸的推导生成随着年龄增长的人脸估算1.2 人脸识别技术的研究方向通过匹配人脸的特征点的过程就是人脸识别技术,它
15、是分别通过对人脸进行特征提取和特征识别,属于模式识别技术中的一种。以下是目前人们公认的几个研究方向5 苏剑波,徐波.应用疏识别技术导论-人脸识别与语音识别M.上海:上海交通大学出版社,2001,45-49.: (1)图像的信息检测:图像的信息检测:该技术即是在不同的环境条件下,对人脸的信息进行检测,包括人脸在图像中的具体位置。虽然在很多情况下,人脸的信息在人为参与下可以很容易的获得,如身份证、学生证上的照片等。然而在大部分应用中,外界的条件并不单一,人脸的位置是无法预测的,因此实际中的人脸的位置具有很大的不确定性。人们只有知道了外界环境中需要的人脸信息,才能通过各种各样的技术来有效识别人脸。可
16、是外界环境对人脸识别的影响是巨大的,因而要进行人脸采集需要克服许多未知的难度。(2) 图像的信息表示:即是人们需要用怎样的方式在计算机系统内能有效的表示人脸的各种不同信息。目前的这些图像信息可以被计算机技术有效的表征出来,人们常用的表征方式有:曲率、角度、欧氏距离、特征脸、固定特征模板等。(3) 图像的信息鉴别:该过程是先处理人脸的图像信息,然后在预先训练的库内和图像信息进行匹配,这就是人脸识别的过程。在整个过程当中,选择人脸特征的表征方式和对应的匹配方式是图像信息鉴别的关键,这将直接影响到人脸识别的效果。(4) 人脸的面部表情研究:即分析人脸的表情,比如:喜、怒、哀、乐、哭等这些能直接体现到
17、人脸上的信息,并通过分析这些信息,抓住这些表情的稳定性特征,对其进行有效的识别。人脸识别有狭义和广义的概念之分,人脸识别的狭义是指从下面的几个方面构建人脸识别系统,即是:人脸检测,人脸特征点提取和人脸的鉴别。本文分别对这三个部分进行了深入的研究和探讨,其中人脸特征点提取是本文的重点,将会进行详细的介绍和实验结果的描述。1.3 研究的现状与存在的困难到目前为止,国内外有多种多样的人脸识别的方法,并且新的研究成果不断涌现。然而,因为人脸识别技术是相当复杂的,要想建立一个能完全实现全自动的人脸识别系统是相当困难的,这包括了计算机视觉、人工智能、计算机网络、数字图像处理和通讯等多个学科领域的知识。而目
18、前人们在该领域的主要研究课题,仍然是在某种应用背景下或者解决特定环境下的人脸识别的问题6 肖冰,王映辉.人脸识别研究综述.计算机应用研究,2005,8,1-57 刘艳丽,赵跃龙.人脸识别技术研究进展.计算机工程,2005,3l(3),10-12。尽管人脸识别已经取得了很多重大的突破,但以下几个内容仍然是今后人们研究人脸识别的主要难点所在,这将会影响人脸识别走向实用化的重大因素。1)人脸本身的特点人脸的姿态的多样性以及表情的丰富性是人脸本身的两个最重要的特点。其中人脸姿态主要是在自然条件下,获取的人脸图像并不都是完整的,人脸的俯仰或者偏转都可能造成面部信息的部分丢失,在精确提取人脸图像的特征点时
19、造成了不小的困难;而人脸并不是一成不变的,其丰富且变化的表情是复杂且细微的。所以,建立一个人脸的情绪和表情模型的分类,把人脸的面部特征的变化和人脸的表情描述联系起来,通过计算机对人脸的变化进行抽象的概括,这也是一个相当重要的问题。2) 环境的影响因为受到距离、光照、尺度、光源和旋转等不确定的因素影响,人脸采集系统在获取人脸图像时将是非常复杂的。在光照不确定的环境中,环境中的各种因素将会影响到每隔像素的亮度:光照的颜色、亮度、位置和周围物体的影响。在目前的人脸识别研究中,很多识别方法都需要对光照有一定的依赖,偏光、过暗或过亮现象都可能影响识别率。所以,在对人脸图像进行特征点提取和分类之前都要作预
20、处理操作。3) 计算机本身的限制如果想要把三维人脸投影到二维的图像上,虽然将会有信息的缺失,但这仍将是一种具有高维数的非常复杂的视觉信息,其中包括大量的像素数据,而且每一个像素都携带了非常多的信息。怎样利用计算机来正确处理巨大的数据量,并能保证人脸识别系统实时性的要求将会是人脸识别研究的主要难点之一。1.4 本文大概安排这篇文章主要是由以下几个部分构成:1) 人脸识别技术的研究背景及基本的理论知识,这个主要体现在文章的前面两章。第一章介绍了人脸识别技术的应用和研究背景、研究方向及研究现状和存在的困难。第二章对人脸识别系统的组成进行了分析说明,对识别过程进行了归纳总结,并介绍了人脸识别的开发环境
21、。2) 本文主要的研究内容,是在第三章到第五章里,对人脸识别的主要算法进行了深入的分析和研究。第三章深入分析和研究了图像的检测定位技术。介绍各种人脸检测的方法,研究并实现了AdaBoost人脸检测算法,包括Haar特征,积分图,Adaboost算法,用Adaboost算法进行简单分类器和强分类器的训练,最后进行级联强分类器的设计。第四章深入研究图像预处理的四个过程,其中包括颜色处理、几何归一化、直方图均匀化和灰度归一化。第五章首先讨论了人脸图像分类函数的选择,并最终选择了欧氏距离分类函数。最后分别对主成分分析算法、二维主成分分析算法进行了全面的阐述和比较,得出它们的优缺点。并且在ORL人脸库的
22、实验基础上,阐明了本文算法的有效性,同时对PCA算法和2DPCA算法进行了全面的实验分析和对比。本文最后对人脸识别技术的一个总结和期望。第2章 人脸识别系统及软件平台的配置2.1 人脸识别系统概况模式识别技术是当今社会的学术研究热点问题,而人脸识别是模式识别中的一个重要的组成部分,它是通过用计算机作为平台,对人脸图像进行分析处理和分类,并从人脸图像信息中获取能表征人脸特征的有效特征信息来进行有效的识别。人脸识别技术是一种可以用来进行身份识别的计算机技术。人们越来越受到重视和认可这种技术。人脸识别系统由四个组成部分组成,包括人脸图像的采集及检测、人脸图像预处理、人脸图像的特征提取以及人脸图像的识
23、别。其中最重要的是人脸特征的提取和人脸图像的识别。2.1.1 获取人脸图像信息不同的人脸图像都能通过摄像镜头采集下来,比如静态图像、动态图像、不同的位置、不同表情等方面都可以得到很好的采集。当用户在采集设备的拍摄范围内时,采集设备会自动搜索并拍摄用户的人脸图像。可是怎样将图像转换成计算机能自动辨别的信息,这就需要把人脸图像转换成数据矩阵,通过这样的转换,就能使计算机有效的进行人脸图像的处理,最终达到对人脸图像进行识别的效果。可以将这样一个过程称为人脸图像的信息获取的过程,通过这种方式,可以把人脸图像转换成计算机能识别的信息。2.1.2 检测定位人脸检测在实际中主要用于人脸识别的预处理,即在图像
24、中准确标定出人脸的位置和大小。人脸图像中包含的模式特征十分丰富,如直方图特征、颜色特征、模板特征、结构特征及Haar特征等。人脸检测就是把这其中有用的信息挑出来,并利用这些特征实现人脸检测。主流的人脸检测方法基于以上特征采用Adaboost学习算法,Adaboost算法是一种用来分类的方法,它把一些比较弱的分类方法组合在一起,得到新的具有很好分类能力的分类方法。2.1.3 图像的预处理人脸图像预处理:对于人脸的图像预处理是基于人脸检测结果,对图像进行处理并最终服务于特征提取的过程。系统获取的原始图像由于受到各种条件的限制和随机干扰,往往不能直接使用,必须在图像处理的早期阶段对它进行灰度校正、噪
25、声过滤等图像预处理。对于人脸图像而言,其预处理过程主要包括人脸图像的光线补偿、灰度变换、直方图均衡化、归一化、几何校正、滤波以及锐化等。2.1.4 特征提取人脸图像特征提取:人脸识别系统可使用的特征通常分为视觉特征、像素统计特征、人脸图像变换系数特征、人脸图像代数特征等。人脸特征提取就是针对人脸的某些特征进行的。人脸特征提取,也称人脸表征,它是对人脸进行特征建模的过程。人脸特征提取的方法归纳起来分为两大类:一种是基于知识的表征方法;另外一种是基于代数特征或统计学习的表征方法。基于知识的表征方法主要是根据人脸器官的形状描述以及他们之间的距离特性(即几何特征)来获得有助于人脸分类的特征数据;基于代
26、数方法的人脸表征包括模板匹配法和基于几何特征的方法两种。2.1.5 图像的匹配与识别人脸图像匹配与识别:提取的人脸图像的特征数据与数据库中存储的特征模板进行搜索匹配,通过设定一个阈值,当相似度超过这一阈值,则把匹配得到的结果输出。人脸识别就是将待识别的人脸特征与已得到的人脸特征模板进行比较,根据相似程度对人脸的身份信息进行判断。这一过程又分为两类:一类是确认,是一对一进行图像比较的过程,另一类是辨认,是一对多进行图像匹配对比的过程。2.2 OpenCV2.2.1 OpenCV简介OpenCV(Open Source Computer Vision Library)即开源计算机视觉库,由Inte
27、l在1999年建立,而现在是由Willow Garage提供的后台支持。OpenCV使用C/C+语言编写,可以运行在多个操作系统上,包括Mac、Windows、Linux等。它还提供了如MATLAB、Ruby、C+ Builder、VC、Python 等语言的接口,因此OpenCV通过大量的通用的算法实现了计算机视觉处理和图像处理方面完美的结合在一起。OpenCV开发构建了一个相当简易的计算机视觉框架,其目的是为了帮助开发人员更加方便地设计计算机视觉方面的相关应用。在OpenCV函数库里,有500多视觉函数,包括医学成像、工厂产品检测、用户界面、信息安全、机器人视觉、摄像机标定和立体视觉等多个
28、领域。由于机器学习和计算机视觉处理是密切相关的,因此OpenCV还有机器学习库。OpenCV库自带的人脸级联分级器具有很好的人脸检测效果,因此在本文中,人脸检测与人脸预处理部分均在OpenCV中完成。2.2.2 OpenCV的系统配置本文采用的编译环境是Visual C+6.0,要进行人脸识别的相关处理,需要调用OpenCV1.0函数库,并对它进行相关的配置。步骤如下: 1)配置函数库的路径 C:Program FilesOpenCVcxcoreincludeC:Program FilesOpenCVcvincludeC:Program FilesOpenCVcvauxincludeC:Pro
29、gram FilesOpenCVmlincludeC:Program FilesOpenCVotherlibshighguiC:Program FilesOpenCVotherlibscvcaminclude配置源文件的路径: C:Program FilesOpenCVcvsrcC:Program FilesOpenCVcxcoresrcC:Program FilesOpenCVcvauxsrcC:Program FilesOpenCVotherlibshighguiC:Program FilesOpenCVotherlibscvcamsrcwindows3)设置环境变量: Path:= C:
30、Program FilesOpenCVbin 4) 每创建一个将要使用OpenCV的VC工程,都需要给它指定需要的lib。菜单:Project(工程)-Settings(设置),然后将Setting for(设置)选为All Configurations(所有配置),然后选择右边的link(连接)标签,在Object/library modules(对象/库模块)附加上 cxcore.lib cv.lib ml.lib cvaux.lib highgui.lib cvcam.lib。如果不需要这么多lib,可以只添加需要的lib。2.3 Matlab与图像处理MATLAB主要面对科学计算、可视
31、化和交互式程序设计的高科技计算环境。它将矩阵计算、数值分析、非线性动态系统以及科学数据可视化的建模和仿真等众多强大功能集成在一个易于使用的视窗环境中,为工程设计、科学研究以及必须进行有效数值计算的众多科学领域提供了一种全面的解决方案,并且在很大程度上摆脱了传统非交互式程序设计语言(如C、Fortran)的编辑模式,代表了当今国际科学计算软件的先进水平。Matlab在处理信息时可以用很常用的数学表达式解决,且Matlab的运算速度快,它具有专门的图像处理工具箱。因此,本文中的特征点提取和人脸分类是应用Matlab完成的。第3章 图像的检测定位3.1 引言人脸识别和人脸检测是人脸识别系统中最核心的
32、部分,经过人们多年的深入研究和发展,出现了许多的算法。整个人脸识别系统的性能怎样,直接决定于选取和使用哪种算法。本章首先简单介绍了人脸检测的相关方法,然后详细介绍了本文使用的算法Adaboost人脸检测算法。该算法的检测精度并不高,但是关于算法带来的问题将在后续过程中得到很好的解决,消除了算法带来的影响。3.2 人脸检测的方法人脸检测是人脸识别的基础,检测得到的结果对后续相关工作有着非常大的影响,是整个人脸识别系统优先解决的问题。经过几十年的发展,人脸检测涌现出了大量的方法。由表征方式的差异,通常可以分为基于特征的检测方法,基于统计的方法和模板匹配法8 梁路宏,艾海舟,徐光祐,张钹.人脸检测研
33、究综述J.计算机学报,2002,5:449-458.。(1)基于特征的检测方法。这种方法是最原始的人脸检测方法。有这种方法的人脸检测系统里,一般需要先检测出人脸图像中的重要特征点(如鼻子、眼睛等)的相对位置和、特征点之间的相对距离和它们的形状等参数,然后要用这些参数构成一个表征人脸的特征向量,通常,特征向量的分量包括了两点间的欧氏距离、角度和曲率等。基于几何特征的人脸检测的方法的优点如下:1)与人脸的机理相符合,比较容易理解;2)仅需存储一些特征矢量,它的存储量非常小; 3)对光照的变化不是很敏感。但是该方法也具有缺点:它只描述了一些重要特征的相对位置之间的关系和形状,而忽略了那些比较细微的局
34、部特征,因此更适合用来进行粗分类。(2)模板匹配法。模板匹配法需要首先建立一些作为参考标准的人脸模板,其中包括人脸的正面或是单独的鼻子、嘴唇、眼睛等。然后通过一些正确的算法来检测各待测区域与标准的人脸模板的相关度(或 称相似度),通过利用检测的数据来判断该区域是否是人脸。该方法的优点是当被检测人脸的大小不一样或在允许范围内有偏转时,由于模板匹配法使用的是可调的弹性模板,所以被测人脸都可以被检测出来。 模板匹配方法的缺点是检测前设计的模板轮廓必须取决于待检测人脸的形状,所以局限性比较大,影响了收敛的效果;并且在对待测图像作全局搜索时,需要计算能量的函数和动态的调整参数,从而导致计算时间过长。(3
35、)基于统计的人脸检测方法。这种方法从整个目标人脸出发,充分运用统计学的方法,利用大量的人脸图像来提取人脸共有的一些规律,就可以运用这些规律检测人脸了。因为人脸图像是相当复杂的,要想描述人脸的特征时非常困难,所以人们越来越青睐基于统计的人脸检测方法。本文就是采用基于统计的方法(即Adaboost人脸检测算)。Adaboost算法是一种基于积分图和矩形特征的算法,将在下文中详细介绍这种方法。3.3 Adaboost算法Adaboost算法属于一种迭代算法。它主要有三个步骤:1)首先需要提取待测图像中的特征点,经过训练从中选出最优的特征点;2)然后再将选取出的特征变换为相应的简单分类器;3)最后将全
36、部得到的简单分类器通过优化和组合,产生合成级联分类器,即可以用于人脸的检测9 严桂中.嵌入式人脸识别软件的设计与实现.重庆:重庆大学,2010:7-9.。从上面可以看出,Adaboost算法的基础是特征的计算和选取。而选取的特征即是特征矩阵(Haar特征),计算的方法是积分图10 Paul Viola,Michael Jones.Rapid Object Detection using a Boosted Cascade of Simple FeaturesC.Conference on Computer Vision And Pattern Recognition,Kauai,Hawaii,
37、2001(1):511 - 518. 11 YANG H,YUAN BZ. Feature extraction in human Face recognition systemC.2000IEEE,Proceeding of ICSP,2000:127321276. 。 3.3.1 Haar特征Haar特征就是白色矩形和黑色矩形在图像子窗口中对应区域的灰度级总和之差,它反映了图像局部的灰度化。常用的Haar特征有三种,如图3-1: 图3-1:三种Haar特征每个特征是由2个或者3个矩形组成,它们分别用来检测中心特征、边界和细线,这些矩形内的特征值可表示为: (3-1)式中:是矩阵所围图像的灰
38、度积分,为组成的矩阵的个数,是矩阵的权。3.3.2 积分图Haar特征值的计算量是非常大的,当图像的像素比较大时,如果直接用图像的灰度值后再计算特征值,达不到人脸识别系统实时性的要求。基于这种考虑,Paul Vilola等人提出用积分图的计算方法,通过积分图,计算的速度大大加快了。积分图的原理是用空间换取时间,该方法是把从图像的起点开始到其它位置所构成的矩形区域的像素之和作为一个数组存储起来,当计算某个区域的时,就直接运用这些数组来计算,而不必再计算这片区域的像素,从而节省了时间,加快了计算速度。3.3.3 Adaboost算法Adaboost算法就是通过训练分类器,属于一种分类算法。它是通过
39、利用许多分类能力弱的简单分类器按照特定的方式进行叠加(Boost),然后构成一个分类能力很强的强分类器9。(1) 简单分类器的训练。下面是第个特征点的简单分类器的表达式: (3-2)其中是简单分类器的值;是阀值;是不等号的方向,规定只能取;为特征值。从公式(3-2)可以得出,一个弱分类器是由对应的阈值和特征决定的,训练一个弱分类器,就是在当前权重的分布情况下,找到最优的阈值,使得该弱分类器对所有训练样本的分类误差最低。(2) 强分类器的训练。 强分类器的特征与简单分类器是一一对应的。Adaboost分类器中包括了非常多的简单分类器,如果按照一定的权重和方法就可以把这些简单分类器串联起来,就可以
40、形成对应的强分类器。经过训练,就能得到个最优的简单分类器,然后将这个简单分类器按照公式(3-3)就可以形成一个强分类器9: 式中: (3-3)3.3.4 级联分类器虽然由多个简单分类器按一定的方式组合而来的强分类器拥有很好的检测效率,但是它消耗的检测时间比较长,达不到人脸识别系统的实时性的要求,所以Micheal Jones与Paulviola等人就提出了基于Adaboost算法的人脸检测级联分类器,不仅使人脸检测具有很好的识别效果,还从根本上解决了人脸识别的速度上的问题。从整体上来说,级联分类器是一个多层次的结构,就是一个退化的决策树。让待检测的人脸图像按一定的次序经过多个简单分类器,如果该
41、图像可能是人脸,就会通过检测,否则就会被判断为错误图像,结束对该图像的检测,接着检测其它窗口9。如下图所示: 图3-2:级联分类器结构图 (1)待测图像 (2)检测结果 图3-3:人脸检测示意图级联分类器能在减少检测时间的同时又能提高人脸的检测率。为了提高图像检测的效率,最开始的几层分类器可以用相对简单的强分类器,这些强分类器通常仅有一两个简单分类器所构成,即只有一到两个矩形特征。然而这些简单的强分类器具有很高的人脸检测率。尽管这种强分类器所检测出来的结构还达不到人脸检测的要求,但是至少因为它自身的特征很简单,可以迅速的减少大量的非人脸的图像,因此可以大大地减少后面的工作量。图3-3是用级联分
42、类器作人脸检测的结果。第4章 图像的预处理4.1 引言模式识别的过程中一个非常重要的步骤就是预处理。输入的图像在从实际的景物转变为数字图像的信息时,因为设备或者条件的不同,比如设备性能的好坏与光照的亮度等,所以会有在对比度不够或存在噪声等不足。另外,焦距大小、距离远近等又会让人脸在整幅图像中的大小和位置不确定。因此为了确保所提取的特征脸在图像里的位置、偏斜和大小不变,以及对光照的不敏感,必须在提取特征之前对图像作预处理工作12 邓楠.基于主成分分析的人脸识别研究.陕西:西北大学,2006:12-16.。本节的预处理工作是在原始0RL人脸库上进行的。主要的预处理工作包括:图象的颜色处理,图像的几
43、何归一化,图像的均衡化与图象的灰度归一化这四部分。经过统一处理后,人脸图像就比较标准了,可以消除一些外在因素的不利影响12。4.2 人脸图像库要开发一个人脸识别系统,都需要有一个自己的包含图像系列或人脸图像的数据库。人脸库的设计对人脸识别系统的识别率起决定性的作用,数据库中的不同表情、姿态和光照变化即使是背景的微小变化都会严重影响系统的系别率,因此人们就建立了能适应不同要求的人脸数据库。1、FERET人脸库13 Phillips P Johnathon,Moon H,Rizvi Syed A,etc.the FERET evaluation methodology for face recog
44、nition algorithms J.TEEE Transactions on Pattern Analysis and Machine Intelligence,2000,22:1090-1104FERET人脸数据库由美国军方建立,是当今最大的一个人脸库,其中包括没人八张图像,三张从右到左的从不同侧面角度拍摄的图像,两张正面照,有些人还具有更多不同表情和不同视角的照片。这个数据库中的人脸都没有戴眼镜,拍摄的条件也是有限制的,图片中的人脸放置在规定大小的范围内。FERET人脸数据库中的图像数目仍在不断地增加,但是到目前为止,该人脸库仍未添加语音信息也未提供运动图像的系列。非美研究机构在获取该
45、数据库是很不方便的,这也是该数据库的最大缺点。2、ORL人脸库14 AT&T Laboratories Cambridge.The ORL Database of Faces. ORL人脸库是由Ohvertti实验室拍摄的一系列人脸图像组成,它是一个美国的专门从事人脸图像研究的实验室,这个数据库内共有40个不同性别、不同种族和不同年龄的人,每个人有十幅图像。ORL人脸数据库里的图像都是灰色的,尺寸为,背景也是灰色的。图像的人脸上的细节和表情都是不一样的,并且都是不断变化的,比如不哭与哭,有没有戴帽子,有没有头发等。人脸的姿态也是有变化的,比如抬头与不抬头,人脸尺寸也有10%以下的变化。相对FE
46、RET人脸库来说,ORL人脸库中的人脸信息时很容易获得的,以前研究工作者的大量实验数据也包含在里面,正是基于这一优点,所以该人脸库就作为了本文实验的人脸数据库。 3、Yale耶鲁人脸库15 ftp:/plucky.cs.yale.edu/CVC/pub/images/yaleface/Tarsets.Yele人脸数据库中含有15个人,每个人具有11张人脸图像,总共165张图片,这些图像的差异就在于人脸表情的不断变化,光照条件是否一致,是否佩戴眼镜等。该人脸库的最大特点就是光照变化很明显,而且人脸部分被遮掩。4、AR人脸库12该数据库是由Purdue大学建立的人脸数据库。AR数据库分别采集了间隔
47、14天两个不同时间段,都是以白色作为拍摄背景的同一批人的人脸图像,包括56女70男总共126人,由每人共有28张彩色的正面图像组成。他们在眼镜、装饰物、服饰、发型或者化妆方面都没有具体的限制。每人两组不同时间段的照片里都含有微笑、愤怒、尖叫和中立等不同的面部表情,双侧光照、左侧光照和右侧光照的不同的光照条件,甚至还有用围巾遮挡部分面部或者佩戴太阳镜。本文的人脸识别率的实验主要是基于ORL人脸库。4.3 人脸预处理算法4.3.1 颜色处理人脸特征点的提取是人脸识别系统中一个重要的步骤,但是提取人脸特征点信息只能在灰度图像上,所以,图像预处理的第一步就是要先对图像进行灰化处理,获得灰度图像。彩色都是由三种最基本的颜色通过一定的比例形成的,即RGB(Red、Green、Blue)。从生活中获取的图像都是彩色的。灰度图像图像只有亮度而没有彩色信息,它和生活中黑白照是一样的。同时,灰度图像是有变化的,比如从暗到亮之间的变化过程。在图像处理的领域中,人们一般都把亮