1、内 容 摘 要生物特征识别是利用人类特有的生理或行为特征来识别个人身份的技术,它提供了一种高可靠性、高稳定性的身份鉴别途径。人脸检测和识别是目前生物特征识别中最受人们关注的一个分支,是当前图像处理、模式识别和计算机视觉领域内的一个热门研究课题,在公安部门罪犯搜索、安全部门动态监视识别、银行密码系统等许多领域有广泛的研究,本文对此进行了较为深入的研究。首先描述了人脸识别技术的研究内容、方法、应用前景,对人脸自动检测与识别技术进行了综述。并且详细介绍了人脸识别很重要的一个步骤“人脸预处理”,文中提到的人脸预处理方法都是从图像处理的角度着手的,主要目的是使人脸图像标准化,并在一定程度上消除光照的影响
2、。本文介绍了几种主要的预处理方法,如几何归一化,灰度归一化。其次,本文重点描述了人脸识别的经典方法,PCA方法。主成分分析方法(Principal Component Analysis ,PCA),即离散K-L变换,是图像压缩中的一种最优正交变换。它用一个低维子空间来描述人脸图像,同时又能在一定程度上保存所需要的识别信息。其基本原理为:由高维图像空间经K-L变换后得到一组新的正交基,对这些正交基作一定的取舍,保留其中的一部分生成低维的人脸空间,即人脸的特征子空间,识别时将测试图像投影到此空间,得到一组投影系数,通过与各个人脸图像比较进行识别。这种方法使得压缩前后的均方误差最小,且变换后的低维空
3、间有很好的分辨能力。但在这种人脸识别技术中,二维的人脸图像矩阵必须先转化为一维的图像向量,才能进行PCA分析,而在这种转化后,造成图像向量的维数一般较高,使整个特征抽取过程所耗费的计算量相当可观。关键词人脸识别;人脸预处理;主成分分析Research on Face Recognition Based on Principal Component AnalysisAbstract Biometrics is a kind of science and technology using individual physiological or behavioral characteristics
4、to verify identity. It provides a highly reliable and robust approach to the identity recognition. Automatic face detection and recognition is one of the most attention branches of biometrics and it is also the one of the most active and challenging tasks for image processing, pattern recognition an
5、d computer vision. It is widely applied in commercial and law area, such as mug shots retrieval, real-tine video surveillance in security system and cryptography in bank and so on. The main research works and contributions are as the following. First, the research content, approach and development a
6、re emphasized. The research status is introduced. The technology of the face detection and recognition are summarized. And the paper describes face preprocessing in detail which is and important step in the face recognition. The face preprocessing methods we adopt are based on image processing techn
7、iques. The main purpose is to get the standardized facial images, and to eliminate the impact of illumination to some extent. In this paper, several key preprocessing methods are introduced, such as geometry normalization, gray-scale normalization and images binary-conversion. Principal Component An
8、alysis (PCA) face recognition methods as the foundation of the K-L transformation is the most superior in the image compression .By using PCA, the dimension of the input is reduced while the main components are maintained. The major idea of PCA is to decompose a data space into a linear combination
9、of a small collection of bases.In the face-recognition literature, the eigenvectors can be referred to as eigenfaces. The probe is identified by first projection to all gallery images. We denote a probe .A probe is comparing the projection to all gallery images, and it causes around the compression
10、the mean error to be youngest. But in the PCA-based face recognition technique, the 2D face image matrices must be previously transformed into 1 D image vectors. The resulting image vectors of faces usually lead to a high dimensional image vector space, where it is difficult to evaluate the covarian
11、ce matrix accurately due to its large size and the relatively small number of training samples. Key wordsFace recognition ;Face pretreatment;PCA目 录第一章 绪 论11.1人脸识别研究的目的意义11.2人脸识别的定义及主要研究内容31.3人脸识别方法综述61.3.1人脸识别方法分类61.3.2常用的人脸识别方法61.3.3基于几何特征的人脸识别方法71.3.4基于K-L变换的特征脸方法91.3.5神经网络方法101.3.6弹性匹配图脸部识别方法121.
12、3.7隐马尔可夫模型的识别方法131.3.8基于FISHER线性判别式的方法131.3.9基于小波包的识别方法141.4人脸识别的应用141.5人脸识别问题中的难点及发展方向151.5.1人脸识别问题中的难点151.5.2人脸识别的发展方向17第二章人脸图像预处理182.1引言182.2人脸图像库简介182.3人脸图像的预处理算法192.3.1图像的几何归一化192.3.2图像的直方图均衡化202.4本章小结23第三章 基于PCA的人脸识别方法233.1引言233.2 PCA人脸识别方法原理233.2.1特征提取的概念243.2.2离散K-L变换的原理243.2.3特征值的选择263.2.4距
13、离函数的选取与分类判别273.3经典的PCA人脸识别283.3.1特征脸算法283.3.2经典PCA人脸识别方法的实现过程293.3.3训练过程303.3.4识别过程32第四章 实验过程显示及分析334.1 引言334.2 实验过程33致 谢37参考文献38附录3942第一章 绪 论1.1人脸识别研究的目的意义随着信息技术及网络的高速发展,人们的生活及身份日益数字化,信息的安全性和隐蔽性越来越受到人们的重视,身份识别与认证技术也因此得到了较快的发展。而人脸识别作为图像处理在这些领域最成功的应用之一,最近几年来成为广大学者的研究热点,越来越受到关注。人类社会的发展进入到21世纪的今天,社会的发展
14、促进了人的流动,进而也增加了社会的不稳定性,这就使得安全方面的需求成为当今社会尤为重要的问题。不论是享受各项服务如网上冲浪、还是居家、办公等都涉及到安全,以往这些行为基本上是通过符号密码来进行安全保护,但是随着服务数量的不断增加,密码越来越多以致无法全部记住,而且密码有时也会被他人所窃取,各种密码被破解的概率越来越高。可见在现代社会中,身份识别己经成为人们日常生活中经常遇到的一个基本问题。人们几乎时时刻刻都需要鉴别别人的身份和证明自己的身份,以获得对特定资源的使用权或者制权,同时防止这些权限被他人随意的取得。传统的身份识别方法主要基于身份标识物(如证件、卡片)和身份标识知识(如用户名、密码)来
15、识别身份,这在很长一段时期是非常可靠和方便的识别方法,得到了广泛的应用。但是,随着网络、通信、交通等技的飞速发展,人们活动的现实空间和虚拟空间不断扩大,需要身份认证的场合也变得无不在。密码遗失、资料被盗的时间不断发生,传统的安全技术已暴露出重大的缺陷,就会给个人乃至整个社会带来重大的甚至难以弥补的损失。面临这样的情况,人们对身份识别的安全性、可靠性、准确和实用性提出了更高的要求,必须寻求身份识别的新途径。于是,近年来人类生物特征越来越广泛地应用于身份识别,而且生物特征可以更好的进行安全控制,世界各国政府都在大力推进生物识别技术的发展及应用。所谓生物特征认证就是利用人的生理或行为特征对个人身份进
16、行识别或是认证的技术,与传统的身份认证技术不同,基于生物特征的身份认证技术,以人体本身所固有的生理特征或行为特征作为识别媒介,运用图像处理和模式识别等技术,实现身份鉴别或验证。相对传统的身份认证方法而言,生物特征认证技术具有不会因当事人遗忘或他人窃取和伪造而进行错误判定,比传统的身份认证方法更加安全方便、特征唯一、不易伪造、不可窃取。生物特征可分为生理特征和行为特征两大类,人脸、指纹、掌纹、虹膜、视网膜等属于生理特征,语音、步态、笔迹等属于行为特征,生理特征相对行为特征而言更为稳定。人脸识别技术基于生理特征进行识别,是最主要的生物特征身份认证技术之一。在各种生物特征认证技术中,人脸识别技术的市
17、场份额仅次于指纹识别技术。人脸识别技术和其他的生物识别比起来有以下几个优点: (1)人脸识别可以在隐蔽的条件下进行,适用于安全监控; (2)数据采集方便,采集设备成本低廉。目前,普通数码相机、数码摄像机和照扫描仪等摄像设备在普通家庭的日益普及进一步增加了其可用性;(3)人脸识别具有快捷、非接触的特点,对用户友好。人脸是人们在日常生活中辨认他人的最常用的特征。利用人脸特征进行身份验证最易被人们接受; (4)存在丰富的现有数据。社会上具有各种大型的人脸数据库,如公安部门的身份证照片数据库,学校里的学生学籍数据库等等。在各种身份证明材料中,一般也会含有标准的正面人脸照片;(5)具有方便、快捷、强大的
18、事后追踪能力。普通人可以对人脸认证系统的结果进行判定,而上述其他生物特征一般只能通过专家认定。人脸识别技术作为生物识别技术的一种,以其特有的稳足性、方便性、唯一性等特点被愈来愈多地应用于除安全问题外的各种身份识别领域。因为其巨大的商业应用前景,受到越来越多的重视。近几十年以来人脸识别技术有了长足的发展,并且逐步走向实际应用阶段。可以预言,在今后的几十年内,随着人脸识别技术进一步发展,人脸识别技术将应用到更多的领域,例如视觉监控、娱乐应用、智能卡、自动身份验证、银行安全、公安系统刑侦破案的罪犯身份识别、身份证及驾驶执照等证件验证、银行及海关的监控、自动门卫系统、视频会议等。目前,各国都加大力度研
19、究生物识别技术,人脸识别这一最类似人类身份鉴别的方式得到了很多人的关注,很多重要的出入场合都在安装人脸识别系统。这些己有的以及潜在的应用领域将推动人脸识别技术不断发展。根据预计,生物特征识别技术在2009-2012年的增长率将保持30%左右,在国内这一数字会更高。整个生物识别技术市场的规模2010年将达到40亿美元左右,国内市场有可能达到40亿人民币。人脸识别作为一种新兴的生物识别技术将占据整个生物特征识别技术15%-20%左右的份额。就算以15%计算,人脸识别的市场规模也将在2010年达到6亿美元,国内达到40亿人民币左右。作为一种最直接、最自然、最容易被人接受的生物特征识别技术,人脸识别致
20、力于探索如何使机器能够自动地根据用户的人脸图像来鉴别用户的身份。 人脸识别的研究涉及模式识别、计算机视觉、人工智能、图像处理、心理学、机器人的智能化研究、医学、生理学和认知科学等,与计算机人机交互领域和基于其它生物特征的身份识别方法都有密切联系。虽然人们可以毫不费力地通过脸部图像来鉴别互相的身份,然而由于成像过程中各种影响因素的变化常常导致同一个人的人脸图像发生非常大的变化,因此建立自动系统完成识别任务是非常具有挑战性的。虽然目前国内外己经有许多实用系统问世,但是只有在非常苛刻的成像条件下,才能得到比较令人满意的识别效果。因此,人脸识别研究仍然远远没有到达完善的境地,还有非常大的发展空间。1.
21、2人脸识别的定义及主要研究内容 人脸识别(Face Recognition)是指基于己知的人脸样本库,利用图像处理和模式识别技术从静态或动态场景中,识别或验证一个或多个人脸。从广义上来说,人脸识别主要包括人脸检测、人脸表征、人脸鉴别、表情分析和物理分类五个方面。 (1)人脸检测(Face Detection):即从各种不同的场景中检测出人脸的存在并确定其位置、尺度和姿势。这一任务主要受光照、噪声、头部倾斜度以及各种遮挡的影响;(2)人脸表征(Face Representation):即确定表示检测出的人脸和数据库中的已知人脸的描述方式。通常的表示方法有几何特征(如欧氏距离、曲率、角度等)、代数
22、特征(如矩阵特征矢量)、固定特征模板、特征脸等;(3)人脸鉴别(Face Identification):即通常所说的人脸识别,就是将待识别的人脸与数据库中的己知人脸比较,得出相关信息。这一过程的核心是选择适当的人脸表示方式与匹配策略;(4)表情分析(Facial Expression Analysis):即对待识别人脸的表情进行分析,并对其分类;(5)物理分类(Physical Classification)即对待识别人脸的物理特征进行分类,得出其年龄、性别、种族等相关信息。狭义的人脸识别就是根据系统新输入的人脸,与己有的人脸数据库进行比对,来判断该人脸是否在人脸库中;如果在该人脸数据库中,
23、则给出所对应的具体的个体信息。一般来说,我们所提的人脸识别指的是狭义的人脸识别。一个典型的自动人脸识别系统如图1.1所示,分为训练和识别两个步骤,两个步骤都需要检测和定位人脸、人脸图像的预处理和特征提取和选择。其中训练一般是离线运算的,而识别是在线操作的。 图1.1人脸识别系统的基本框图(1)人脸的检测和定位,人脸检测与人脸定位是相互联系但又有所区别的两个概念。人脸检测的目的是检测输入的图像中是否含有人脸,而人脸定位是确定输入的图像中人脸位置以及大小,并将人脸从背景中分割出来。检测人脸对于简单背景的同一人的人脸图片是比较容易实现的,但当人脸的背景变得复杂,或者图片中的人脸属于多个人时,检测就会
24、变得相对困难。人脸检测与定位是一项很复杂的工作,这是由于光线、视角、表情、墨镜、遮挡物等各种因素,以及可能出现的图像噪声或干扰,即使是同一人的人脸图像也可能会产生很大的差别,这使得人脸检测与定位工作变得相当困难。作为人脸识别的基础,人脸的检测与定位是人脸识别研究的另一个重要方面。(2)人脸图像的预处理,人脸检测得到的人脸图像,如有设备条件的差异,可能存在光照、噪声、角度不好等缺陷,一般需要对图像进行几何归一化、灰度归一化及边缘检测等处理。几何归一化主要是指将人脸图像进行一定的处理变为像素大小统一且人脸关键位置一致的图片。灰度归一化则就是对人脸图像进行光照补偿,消除光照对图像的影响,进而提高识别
25、率。(3)特征提取和选择,对人脸进行识别主要依据人脸的特征,也就是说依据不同个体之间有较大差异而对同一个体则比较稳定的度量。在实际操作中,我们主要是通过各种变换来达到对图像进行降维的效果,如特征脸方法中K-L变换就是特征提取,而主元选取就是特征选择。除此之外还有DCT, Gabor变换、分数阶傅里叶变换等都是基于人脸的整体特征提取,还有基于人脸局部特征的提取方法,如利用显著器官(眼镜、眉毛、耳朵、嘴巴等)之间的距离关系,以及通过训练学习求得的局部特征。(4)人脸识别,在识别前对人脸图像库进行处理,得到每个个体的特征信息,单独建立一个新的人脸图像数据库,在识别过程中,采用同样的方法得到测试人脸图
26、片的特征信息,并与库中的每个个体信息进行比较。在比较之前需确定相似性尺度,常用的是欧氏距离函数和基于贝叶斯准则的概率尺度。一般情况下,识别可以分为两种:一种是人脸辨认,即需要确认被识别者的具体信息;另一种是身份证实,只需要判断识别对象是否是数据库中个体的一员。整个人脸识别的研究工作主要是围绕特征向量的提取和特征选择展开的。因为之前的预处理步骤与图像处理的工作是相通的,而之后的识别步骤与一般的模式识别问题是一致的。1.3人脸识别方法综述1.3.1人脸识别方法分类根据研究角度的不同,我们对人脸识别方法可以进行不同的分类方法。根据图像来源途径的不同,可以分为动态和静态的人脸识别;根据输入人脸图像的角
27、度,可以分为基于正面、侧面和倾斜人脸图像识别;根据图像的颜色特点,可以分为彩色图像和灰度图像的人脸识别。本文的人脸识别研究是基于静态、正面的灰度图像的。根据对人脸图像不同的特征提取方式,我们大致可以人脸识别方法分成两种:一是基于局部特征分析的研究方法;二是基于整体的研究方法,它考虑到模式的整体属性,主要有特征脸方法、弹性图匹配方法、神经网络方法及隐马尔可夫模型方法等等。基于局部特征分析的方法识别结果取决于特征定位算法的准确性,而且要求图像的像素较高,因此要近距离拍摄图片。基于整体的识别方法也各自有自己的缺陷,所以近年来的研究趋势是将人脸的局部特征分析和整体识别结合起来。1.3.2常用的人脸识别
28、方法对人脸识别方法的研究主要有两大方向:一是基于人脸图像局部特征的识别方法;二是基于人脸图像整体特征的识别方法。基于人脸图像局部特征的识别通常抽取人脸器官如眼睛、眉毛、鼻子和嘴等器官的位置,尺度以及彼此间的比率作为特征。进一步地可以用几何形状拟合人脸器官,从而以几何参数作为描述人脸的特征。由于此类方法通常要精确地抽取出位置、尺度、比率或几何参数作为描述人脸的特征,因此对人脸图像的表情变化比较敏感。同时,人脸器官分割的精确度也对人脸特征的提取有一定的影响。另外,该类方法并没有充分利用到人脸图像本身具有的获度信息,该方向已经不是人脸识别技术发展的主流方向。基于人脸图像整体特征的人脸识别方法由于不需
29、要精确提取人脸图像中部件的具体信息,而且可以充分利用到人脸图像本身具有的灰度信息,因此可获得更好的识别性能。目前,绝大部分关于人脸识别方法的文章都是基于人脸图像整体特征的,主要有特征脸法、最佳鉴别向量集法,贝叶斯法,基于傅立叶不变特征法,弹性图匹配法,其他相关方法有线性子空间法,可变形模型法和神经网络法。这些方法中有的侧重于表述人脸图像的特征提取,如弹性图匹配法和傅立叶不变特征法;有的则侧重于分类,如最佳鉴别向量集法、贝叶斯法和神经网络法;而有的则侧重于人脸图像重构,如特征脸法和线性子空间法。所有这些基于人脸图像整体特征的人脸识别方法均取得了一定的识别性能。1.3.3基于几何特征的人脸识别方法
30、基于几何特征的人脸识别方法主要源于人脸识别的初期研究阶段。这种方法是以人脸各个器官和几何关系为基础进行算法设计。对于不同人来说,脸上的各个器官,如眼睛、鼻子、嘴巴以及整个脸部的轮廓具有不同的形状、大小、相对位置和分布情况。在基于几何特征的人脸识别方法中,可以用一个矢量来表示提取出来的几何参数。如果要获得一个准确、稳定和可靠的识别结果,就要求这些被选出的几何特征参数包含足够丰富的辨识人脸的信息,且能反映不同人脸之间的差别。也就是说对这些矢量要求具有较高的模式分类能力,同时还要有一定的稳健性,能够消除由于时间变迁、光照变化等其他干扰因素所带来的影响。具体来说,这些几何参数一般包括人脸上两个指定特征
31、点之间的欧式距离、边缘曲率、角度等等。在Brunelli和Poggio的文献中给出了一组典型的人脸几何特征参数:(1)眉毛的厚度(2)眉毛与眼睛中心的垂直距离;(3)描述左眼眉毛弧度的12个数据;(4)鼻子的宽度;(5)鼻子在面部上的位置;(6)嘴巴的垂直位置、嘴巴的宽度和上下嘴唇的亮度;(7)描述下颚形状的11个半径数据;(8)以鼻子位置为准的脸部宽度;(9)颧骨宽度(半脸宽)。当这些几何特征参数提取出来后,就可以采用最小距离(欧式距离)分类器,将待识别人脸特征向量与数据库中人脸特征矢量进行比较,取距离最近者作为识别结果。在实际应用过程中,基于几何特征的人脸识别方法存在着两个方面的问题:(1
32、)如何快速、准确地检测出人脸的重要标志点依然是一个没有很好解决的问题。(2)脸部几何特征在人脸辨识中的有效性问题,即脸部几何特征能够提供多少可供识别的信息量。虽然各人脸的器官在形状、大小及分布上各不相同,但是这种器官上的差异性更多是体现在某些细微的感觉意义上。例如眼睛显得比较小、鼻子显得比较宽,以及皮肤的纹理、颜色上的差异等等。显然,这些特征中的一部分是难以精确测量出来或者是不能用几何参数准确描述的。所以仅靠增加脸上几何参数的数目来提高人脸识别率是不太现实的。由于进一步改善测量精度是十分困难的,因而通过增加脸部几何参数的数量来改善识别率结果,其影响是极小的。因此,基于少量人脸几何特征进行大规模
33、人脸辨识的可靠性是不容乐观的。1.3.4基于K-L变换的特征脸方法基于特征脸的人脸识别方法的基础是KL变换。KL变换是图像压缩中的一种最优 正交变换。通过KL变换,可以把图像在高维空间表示转换到低维空间表示,而由低维空间恢复的图像和原图像具有最小的均方误差,从而可以以图像在低维空间的变换系数作为人脸图像的描述特征。KL变换用于人脸识别的前提是人脸图像处于低维空间,并且不同人脸是线性可分的。通常情况下,KL变换的变换矩阵由训练样本类间散布矩阵的特征矢量生成。人脸图像在前面的特征矢量上的投影有较大的能量,称为主分量;在后面的特征矢量上的投影具有较小的能量。称为次分量。当舍弃部分次分量时,KL变换也
34、称为主成分分析法(PCA)。由于人脸图像具有相似的形状和结构,人脸图像在主分量上的投影过多地反映了光照变化,因此有人提出舍弃人脸图像在前3个特征矢量上的投影,而用人脸图像在其余特征矢量上的投影作为描述人脸图像的特征。 KL变换是数字图像压缩领域里的一种最优变换,它使从低维空间恢复的人脸图像和原图像的均方误差最小。但KL变换只是从压缩角度来看是最优的,从分类角度来看却不是最优的。虽然它考虑了人脸图像的所有差异(从压缩角度),但没有考虑这些差异是类内差异(如光照变化,头饰变化或几何变化)还是类间差异(从分类角度)。K-L变换是图像压缩的一种最优正交变换,人们将它应用于特征提取,形成了子空间法模式识
35、别的基础。将K-L变换用于人脸识别,需要假设人脸处于低维的线性空间,不同人脸具有可分性。高维的图像空间经过K-L变换后得到一组新的正交基,保留其中重要的正交基从而形成了低维的人脸空间。若将所有子空间的正交基排列成图像阵列,则正交基呈现人脸的形状,因此这些正交基也被称为特征脸。选择那些正交基形成的子空间则有不同的考虑,与较大特征值对应的一些正交基(也称主分量)能够表达人脸的大体形状,而具体细节需要那些小特征值对应的特征向量(也称次分量)来加以补充描述,因此低频成分用主分量表示,高频分量用次分量表示。采用主分量作为新的正交空间的正交基的方法称为主分量_(Principal Component An
36、alysis,简称PCA)方法。 K-L变换在90年代初受到了很大的重视,实际用于人脸识别取得了很好的效果,一般库德大小为100幅左右,识别率在70-100之间不等,这主要取决于人脸库图像的质量。从压缩能量的角度来看,K-L变换是最优的,变换后的低维空间对于人脸有很好的表达能力,较好的判别能力。选择训练样本的散布矩阵作为K-L变换的生成矩阵,其最大特征向量反映了该样本集合的最大分布的方向,但这是图像统计方法,而不是人脸统计方法。它查找的是图像之间所有的差异,并根据这些差异来确定不同人脸间的距离,而不管这些差异是由于光线、发型或背景的改变引起的,还是属于人脸本身的内在差异,因此特征脸的方法用于人
37、脸识别存在理论的缺陷。研究表明,特征连的方法随着光线、角度以及人脸的尺寸的引入而识别率急剧下降。主分量的方法使得变换后的表达能力最佳,次分量的方法考虑了高频的人脸区分能力,但是由于外在因素带来图像差异和人脸本身带来的差异对K-L变换而言是不加任何区分的,因此,如何选择正交基并不根本解决问题。改进的一个思路是针对干扰所在,对输入图像作规范化处理,包括输入图像的均值方差归一化,人脸尺寸归一化。另一种改进是考虑到局部人脸图像受到外在干扰相对较小的情况,除了计算特征脸之外,还利用K-L变换计算出特征眼、特征嘴等。将局部特征向量加权进行匹配得到一些好的效果。总之,特征脸方法是一种简单、快速、使用的基于变
38、换系数的算法,但由于它在本质上依赖于训练集合测试集图像的灰度相关性,而且要求测试图像与训练集比较接近,所以存在着很大局限。1.3.5神经网络方法人工神经网络是一种以大量的处理单元(神经元)为节点,处理单元之间实现加权值互连的拓扑结构。人工神经网络中的处理单元是人类大脑神经单元的简化。处理单元之间的互连则是轴突、树突这些信息传递路径的简化。根据不同的应用场合,现已研究出较多的神经元网络模型及其动态过程的算法。人工神经元通常采用非线性的作用函数,当大量神经元连接成一个网络并动态运行时,则构成了一个非线性动力学系统。人工神经网络具有自组织性、高维性、模糊性、分布性和冗余性等等特点,较冯-诺依曼体系的
39、计算机更适合模拟人类大脑的思维机理。但总的来说,由于人类对自身思维机理认识的不足,所以对人工神经元作了极度的简化,这种模拟表现为极其肤浅和简单。很多脸部识别系统都采用了多层感知机(MultiLayer Perceptor)作为人工神经网络的基本结构。多层感知机由几层全互连的非线性神经组成。神经元之间有权值连接,权值包含了训练模式空间的特征。训练过程就是调整权值的过程,最常用的算法就是BP法则。采用多层感知机进行面部识别的目的就是建立一个关于脸部的紧凑表示,这相当于面部特征的抽取。因为隐层节点的数目L通常要远远小于输入层和输出层的节点数目,从而多层感知机将高维德输入数据变换到一个低维子空间中,同
40、时保留了原始数据中最重要的信息。如果隐层神经元采用线性作用函数,则多层感知机张成的降维子空间将与主元分析法张成的子空间一样。主元分析法的方差是由大到小排列的,而多层感知机的方差是均匀分布到每个隐层神经元上。多层感知机的输入形式有很多种,最简单的就是将整个人脸图像作为输入层,也可以对人脸图像进行采样,然后用低分辨率图像作为输入层。还有的文献采用了二进制图像的等密度区域或多个局部面部特征作为不同多层感知机的输入层。直接使用BP神经网络进行人脸识别的问题在于网络过于庞大和复杂,例如对于一幅128128的人脸图像,输入层和输出层的节点数目将达16438。显然,训练这样大的一个网络将花费很长时间,需要的
41、存储量也会很高。由此可以看出,人工神经网络有着与Eigenface方法非常相似的表达方法。一般来说,BP算法的收敛速度非常缓慢,学习过程可能需要对整个训练集进行上千次反复迭代运算,这是神经网络实际应用的一个问题。此外,BP算法以误差梯度下降的方式达到极小值,但在实际应用中,容易陷入到局部极小中,无法得到全局最优解,这也是有待解决的一个问题。1.3.6弹性匹配图脸部识别方法在利用图匹配进行识别的方法中,一个目标(如一个人脸图像)可以采用一张图(Graph)来表示。根据局部化空间频率得到的一系列多分辨率秒数值可以用来表示图中的节点数值。物体内部的空间关系则可以用节点之间的几何距离表示。Gabor变
42、换是进行时频分析的有效工具,该函数在时间域和频率域上都是局部化的,通常将Gabor特征用到针对脸部识别的弹性图匹配中。Gabor特征在网格节点上提供了一个多尺度边缘强度。一般来说,图像中的关键部位会有较大的Gabor系数。同样的,对于一个待识别的人脸图像也可以定义一个网格G及网格上的特征矢量。在弹性图匹配(Elastic Graph Matching)方法中,两幅图的距离是通过寻找G与M之间的最优匹配来得到。在弹性图匹配方法中,将人脸图像库中的图像和待识别图像都用特征矢量图表示。通过对突遇图之间的拓扑结构的匹配以及节点与节点之间的特征矢量值的比较,可以进行人脸识别,这就将模板的图像匹配转化成了
43、模板的图匹配。在寻找最佳匹配方法时,希望能够同时维持特征数值接近和局部几何关系。弹性图匹配方法的最大优点在于对光和表情变化的相对不敏感性。这主要归功于两个原因:(1)用Gabor变换可提取图像的局部多分辨率特征;(2)在计算距离或者能量函数时,使用了变形匹配方法。弹性匹配图方法的主要缺点在于计算量大。1.3.7隐马尔可夫模型的识别方法隐马尔可夫模型(Hidden Markov Model)一般应用于非平稳时间序列矢量的统计建模,在语音处理,特别是语音识别中得到广泛的应用。隐马尔可夫模型为一个观测序列提供了一个统计模型n引,该模型由两个互相关联的过程组成:(1)一个是底层不可观测的马尔可夫链,它
44、由有限个状态、一个概率转移矩阵和一个初始状态概率分布函数组成。(2)另外是一组联系每一个状态的概率密度函数。在使用隐马尔可夫模型的面部识别方法中,首先将一个人脸图像采集成一系列的条状图,将一幅二维图像变成一个一维矢量序列,这个序列构成了隐马尔可夫模型的观测矢量。由于人脸的特定构造,在这种抽样方式下,脸部特征带的出现将服从于一定的顺序,所以该模型可以用一个从左到右的隐马尔可夫模型表示,其中状态的转移只能按照从左到右的方式进行。接着是训练该隐马尔夫模型,由以下几个步骤组成:(1)建立一个隐马尔可夫模型;(2)用训练数据迭代计算初始参数值;(3)用BaumWelch方法重新估计参数值。识别通过一个V
45、iterbi识别器完成,用代表不同人的隐马尔可夫模型与待识别图像匹配,最高匹配者被选出来。1.3.8基于FISHER线性判别式的方法P.Belhumeur提出了一种基于Fisher线性判别式的人脸识别方法,与Eigenface方法相对应,Belhumeur称其为Fisherface,这种方法对面部表情和光照方向不敏感。类似于Eigenface方法,Fisherface方法也是采用线性投影技术将人脸图像从高维图像空间转化到低维特征子空间。在这个低维子空间中,如果特征和投影方向选择合适的话,人脸特征可以做到对光照方向和表情变化不敏感。与Eigenface方法不同的是,Fisherface采用的投影
46、方向几乎与类内散布方向垂直,而Eigenface方法采用的投影方向是使所有类散布最大化。Belhumeur认为这种使所有类散布最大化的PCA方法会保留那些对分类不利的光照方向和表情信息。因此可认为:对以均方误差为准则的脸部重建来说,PCA方法是一种最优的方法:但从模式分类和辨识的观点来看,PCA方法则不一定能够取得最优的结果。1.3.9基于小波包的识别方法基于小波包的面部识别方法首先对一幅人脸图像进行小波包分解。因为小波包分解得到的不同频带包含有不同的人脸信息,所以从每一个小波包中可以提取出不同的面部特征。对于小波包分解得到的离散逼近稀疏,Garcai进一步将它分解成三个部分,分别是边界区、上
47、半部分和下半部分,然后就可以分别计算这三个区域的均值和方差,加上另外15个离散细节区域的方差,组成一个包含有21个分量的特征向量。小波包分解是一种多分辨率分析方法,能够提供良好的面部纹理描述,所以有利于提取面部特征。1.4人脸识别的应用任何一种技术的发展都是由于受到了实际应用需要的激励,人脸识别技术也不例外,它最初就是公安部门要把它用于罪犯照片的存档管理和刑侦破案。而现在逐步扩大到社会生活的各个领域,例如在海关边检、物业管理、网络安全、视频会议、计算机访问控制等方面都有着广泛的应用。我们从一下几个方面具体介绍人脸识别技术的应用:(1)在公安系统的罪犯识别方面,当公安部门获得案犯的照片后,可以利
48、用人脸识别技术,在存储罪犯照片的数据库里找出最相像的嫌疑犯。由于罪犯数据库往往很大,如果这项搜索工作由人工完成,不仅效率低,而且容易出错,因为人在看了上百幅人脸图像后,记忆力会下降,而由计算机来完成则不会出现此问题;(2)身份证、驾驶证以及其他很多证件上都有照片,现在的证件验证一般都是由人进行验证,如果利用人脸识别技术,这项工作就可以交给机器完成,从而实现自动化智能管理。当前普遍使用的验证方法有符号或条形码标记,比如信用卡、自动提款机等此类验证的安全性比较低。如果运用人脸识别技术,则安全性将大大改善;(3)可以进行入口控制。入口控制的范围很广,它可以是楼宇、单位或私人住宅入口处的安全检查,也可以是计算机系统或情报系统的入口控制。目前比较常用的手段是检查证件。人员频繁出入时,保安人员再三检查证件是比较麻烦的,而且安全系数也不高。在保密要求非常严格的部门除了证件,还可以加上另外一些生物识别手段,如指纹识别、手掌识别、语音识别等。人脸识别与之相比,具