资源描述
本科毕业设计(论文)
基于PCA的人脸识别算法研究
2016年 6月3日
本科毕业设计(论文)
基于PCA的人脸识别算法研究
学院:信息科学与工程学院 专业(方向):通信工程
题
目
题目名称
基于PCA的人脸识别算法研究
题目性质
1.理工类:工程设计 ( √ );工程技术实验研究型( );
理论研究型( );计算机软件型( );综合型( )。
2.文管类( );3.外语类( );4.艺术类( )。
题目类型
1.毕业设计( √ ) 2.论文( )
题目来源
科研课题( √ ) 生产实际( )自选题目( )
主
要
内
容
人脸识别是人脸识别系统中一个非常重要的研究方向。PCA算法是主成分分析法,通过此算法可将问题的关键信息保留并反映出来。本课题设计基于PCA的人脸识别算法,设计一种简单,快速,有效的人脸识别方案,并基于Matlab进行仿真实验,分析算法性能。
基
本
要
求
[1]通过查阅相应书籍和资料,掌握算法的基本理论。比较并分析不同算法的性能。
[2]设计一种基于PCA算法的人脸识别方案。
[3]利用Matlab实现设计方案。
[4]分析算法在提高人脸识别准确性方面的性能。
[5]研究内容有实际应用价值,
参
考
资
料
[1]现代图像处理技术及Matlab实现 张兆礼编著 人民邮电出版社 2001
[2]人脸图像特征抽取与维数研究[D] 金忠 南京理工大学出版社 1999
[3]模式识别(第二版) 边肇棋,张学工著 清华大学出版社 2000
[4]中国期刊网上的相关文章
周 次
1 — 4 周
5 — 8 周
9 — 12 周
13 —16 周
17 —18 周
应
完
成
的
内
容
收集资料
熟悉课题内容
确定设计思路
熟悉程序设计语言,
确定算法的实现方案
编写程序实现设计方案
上机调试并进行优化
实验结果整理和总结,
撰写论文
课题总结
答辩
指导教师:
职称:副教授 2016年 6 月 6 日
注:周次完成内容请指导老师根据课题内容自主合理安排。
摘要
摘要
社会的进步和科技的发展使人们急需一种可靠、简便、快捷的身份识别技术。近些年来人脸识别由于其具有非接触的识别方式、快速的识别过程和稳定的识别系统等优点受到了人们广泛的关注。本文基于MATLAB,设计并实现了一种基于主成分分析法-PCA算法的人脸识别系统。
本文主要研究了基于PCA的特征脸识别的方法,利用PCA中的霍特林变换和奇异值分解定理得到人脸分布的主要成分,即特征向量(特征脸),构造出特征脸空间。将训练库中的人脸图像和待识别的人脸图像分别投影到该空间上,基于几何距离最小的原则作为匹配的识别图像输出。采用ORL人脸数据库进行模拟,借用MATLAB工具仿真实现了该人脸识别系统,实验结果表明该系统能够在人脸表情变化,姿势变化,有无遮挡物等情况下达到较高的识别率。所以基于PCA的人脸识别算法的实现研究是有一定意义的。
关键词 人脸识别;PCA;特征脸;MATLAB
I
Abstract
With the social progress and technological development so that people need a reliable、simple、quick identification technology.In recent years,face recognition because of its recognition process of on contact detection method,fast and stable has attracted widespread concern.In this paper,based on MATLAB,the design and implementation of a face recognitionsystem based on principal component analysis.
This paper mainly studied the Engenface of face recognition based on PCA method,using the K-L theorem and singular value decomposition theorem to get the main components of the face distribution,the feature vector(eigenface).then construct the face space.Projecting the training in the library face image and identify face image onto the face space respectively.The matching image output based on the principle minimum geometric distance Using the ORL face database and MATLAB simulation tools to realize the human face recognition system.The experimental results show that the system can changes in facial expression,posture change,the presence of obstructions sunch as cases,to achieve high recognition rate.So the realization of the algorithm of face recognition based on PCA research has a certain significance.
Keywords face recognition;principalcomponent analysis;eigenface; MATLAB
目录
摘要 I
Abstract II
第1章 绪论 1
1.1 选题背景及意义 1
1.2 国内外研究现状 2
1.2.1 国外研究现状 2
1.2.2 国内研究现状 3
1.3 人脸识别技术的研究内容与技术难点 3
1.3.1 人脸识别技术研究内容 3
1.3.2 人脸识别技术研究难点 3
1.4 本文研究内容与结构安排 4
第2章 人脸识别相关技术介绍 5
2.1 系统概述 5
2.2 人脸识别主要技术 5
2.2.1 二维人脸识别算法介绍 5
2.2.2 三维人脸识别算法介绍 6
2.3 常用的人脸图像库 6
2.4 人脸的特征提取 7
2.4.1 几何特征提取法 7
2.4.2 代数特征提取法 8
2.5 本章小结 10
第3章 基于PCA的人脸识别算法 11
3.1 引言 11
3.2 K-L变换 11
3.2.1 K-L变换原理 11
3.2.2 K-L变换性质 12
3.3 SVD定理 14
3.4 距离的计算 15
3.5 基于PCA的人脸识别 16
3.5.1 人脸的表示 16
3.5.2 特征脸空间的构造 16
3.5.3 特征提取 17
3.5.4 人脸识别 18
3.6 MATLAB仿真实现 18
3.7 结果分析 24
3.8 本章小结 26
第4章 与基于Fisherface方法的特征提取原理对比 27
4.1 PCA方法的优缺点 27
4.2 基于Fisherface法的人脸特征提取理论介绍 27
4.3 FisherFace方法的优缺点 28
4.4 两种方案的理论对比 29
4.5 本章小结 30
结论 31
参考文献 32
致谢 34
附录 1 35
附录 2 42
附录 3 46
附录 4 55
III
第1章 绪论
第1章 绪论
1.1选题背景及意义
当今时代社会高速发展,技术不断进步。自动化,智能化及科技化已是日常生活的常态。信息的安全的重要性也日益凸显,普通的身份识别已经无法保证信息的安全性。再加上计算机软件及硬件的性能在近几年内飞速的提升,人体的生物识别技术因其高效、稳定、快速、唯一的特性得到了相当大的重视和发展。生物识别技术利用的主要是人体的特有特征,例如指纹,人脸,虹膜等。而人脸作为区分人与人差异的重要特征,得到了国内外研究学者的青睐。所谓人脸识别指从用计算机从图像或者图像的序列中检测到人的脸部,对其进行身份判别。人脸识别的优势具体体现在以下几个方面[1]。
(1)操作具有隐秘性质,适用在监控,安全,公安等行业领域。
(2)采集时非直接接触人体,容易接受没有侵犯性。
(3)快速便捷,具有实时的追踪能力。
(4)符合人类的识别习惯,以人为本,而且互动强。
(5)图像采集的方式灵活,硬件设备(摄像头)的成本比较低。
正是这些优势给人脸识别技术带来了广泛的应用前景,在国家安全领域,各种各样的门禁系统,视频系统、监控系统、公安布控、身份验证等都是典型的应用;在经济和民生领域中,各类存值卡,银行卡,信用卡等持有人的身份验证等具有很高的应用价值;在娱乐领域有智能玩具,虚拟游戏玩家等有趣的应用。均可将其归为以下四大类。
(1)刑警侦查破案。事先将犯罪分子的各种信息包括人脸图片入库存储,将得到的嫌疑犯的照片利用人脸识别技术识别后,从数据库中找出最为相似的照片,进行比对,对破案有着很大的辅助作用。
(2)证件识别验证。居民身份证,护照等证件都有照片,现在还多是人工验证,如果利用人脸识别技术就能实现此类工作的自动化,智能化。银行金融部门等的身份验证,可通过拍摄照片后与后台人脸数据库进行比对,无须密码进行交易。
(3)出入口控制。该项应用涉及到的范围很广,可以是办公楼宇,小区住宅的入口检查,或某些安全部门的入口检查。目前比较常用的是保安人员再三核查证件。这样效率低下,也不够人性化。在一些安全级别较高的地方,可以使用人脸识别,加证件识别。
(4)视频监控。现在几乎所有的办公大楼,商场,娱乐场所等公共场合都设有24小时监控视频,在对这些视频图像后期集中分析与处理时,就要利用人脸的检测和识别技术。
1.2 国内外研究现状
1.2.1国外研究现状
人脸识别技术的重要性在不断凸显,很多专家学者都参与到人脸识别的研究大潮中。目前国外有以下几种研究方法[2]:
(1)模板匹配,包括变形和固定模版两种方式。早期系统中固定模版使用较多,但是由于人脸的特点具有很强的变化性,找到一些标准的模板来描述人脸的共同特点非常困难。变形模版与固定模版原理相通,只是变形模版还包括一部分变动的元素。这些变动元素通常通过手工和系统自动构造来表示。
(2)示例学习,本方法的主要原理是在已给的示例中总结出一般性的原则。且要求其能够在判别过程中接受所有正例并可以排斥所有的反例。人脸识别中同理,也需要产生某种规则,要求其可以接受人脸而排斥非人脸,在判别中,在训练样本的阶段时要用到大量的且高纬度的数据,从而提高判别的精确率。但是这同时会给后续的算法设计增添难度。需要考虑到如何判别是不是人脸和对数据维度的降低。
(3)神经网络,该方法其实同样是基于样本学习。到现在为止,神经网络的方法取得如下成果[3]:
MIT的学者首先在检测样本是否为人脸时应用了聚类分析的方法,利用MLP网络作为分类器,以测试样本和人脸样本子集的距离差为度量原则进行分类。
Raphael则利用多层神经网络,通过CGM及MLP实现了迅速和精准的人脸检测,且该方式可以运用到网页端的人脸图像检索中。
Shang-Hung Lin等人利用神经网络建构了一个较为完整的人脸识别系统。三个基于概率决策神经网络构成了这个系统,有人眼睛定位,人脸的检测和对人脸识别的功能。
除以上之外,Mohamed还提出了基于照明、面部表情等差别产生的人脸识别障碍的方法。其有两点创新理念:一是提取面部特征用新的多尺度方向框架。二是通过在识别阶段改变正则变化的参数来开发共享任务产生的关系,进而可以改进多任务的稀疏学习架构。Lacramioara还提出了基于高阶奇异值分解的新算法,此算法仅利用第三阶张量来编写不同的张量矩阵乘法模式,该算法在识别率上比特征脸算法更加成功。
1.2.2 国内研究现状
国内的研究起步相对较晚,大概在二十世纪末才开始。雷震等人将人脸识别不仅应用在识别人脸,还应用在了识别卡片,蔡芷玲等人将人脸识别技术运用到了安卓设备中,这对移动设备的信息安全做出了很大的贡献。李根将面部特征的人脸识别算法和进化算法结合,提出了新的研究算法。刘锐则对人脸表情,光线遮挡,不同姿势等问题提出来新的解决办法,这些办法可以进行有效的身份识别。
1.3 人脸识别技术的研究内容与技术难点
1.3.1 人脸识别技术研究内容
人脸识别的过程就是指从图片中提取有效的特征值来表征该人脸,并以此作为区分。人脸识别的算法一般都由以下四部分组成:
(1)人脸的检测和定位[4]:该过程主要是从图片中检测是否有人脸,然后可以从图片中提取出人脸。光线强弱,表情变化,头部脸部的遮挡,头部姿态、各种噪音等造成了人脸的可变性相当高。这是一项非常复杂的技术。
(2)图像的预处理:为了增强人脸的特征,此步骤就是在识别前对图像进行各方面的处理。方法主要有,直方图修正,锐化与平滑,灰度变换以及图像的几何校正等。
(3)人脸的特征提取:此步骤主要是想从人脸中提取关键的特有的特征,次特征要能够表示出该人脸的唯一性,主要有几种表示方法,几何特征法、人工神经网络法、人脸特征脸法、模板匹配法。
(4)人脸识别:以待识别人脸和数据库人脸在特征脸空间中的距离为标准,输出最小的距离,达到身份验证的作用。
1.3.2 人脸识别技术研究难点
人脸识别技术因其独有优势得到了不断的发展,但在此过程中还是遇到很多难点[1],如下所述:
(1)时间变动:随着时间的改变,人脸的特征会相应发生一些变化,这将对现有的人脸库造成识别困难。因此研究时间的鲁棒性也是人脸识别算法的研究重点与难点。
(2)遮挡物问题:在难以配合的环境下,头发,帽子,眼镜等遮挡物这都将对人脸的识别产生很大的影响,在图像采集的时候不能采集到完整的人脸图片,造成识别精度的下降。
(3)姿态多变问题:目前来看研究的主要方向还都是人脸的正面部分,还有一些变化幅度很小的侧面人脸的部分。在实际的采集头像环境中,人脸的角度都是不受控制的,当人脸的姿态有复杂的变化时,这也将会导致算法精确度的明显降低。
(4)计算速度问题[5]:人脸数据库中存储着大量的人脸数据,能够保证快速准确的人脸识别是非常重要和关键的问题。随着技术不断的进步与完善,识别效果会越来越精确。实际使用也一定会越来越智能化。
1.4 本文研究内容与结构安排
本论文以MATLAB为实现工具,来研究基于PCA的人脸识别算法,要实现将待识别的人脸图片输入系统后,能够从预存人脸库中匹配出本人的图片并输出。本论文的结构安排如下。
第1章绪论主要介绍了人脸识别算法的研究意义及其研究背景,并查阅相关文献对国内外现状进行了简要的总结分析。并对人脸识别技术的研究内容和研究难点做了介绍,方便读者对其整体的理解。
第2章主要是人脸识别当中的相关技术综述。对人脸识别系统进行了广义的概括。并对人脸识别当前主流的二维人脸识别和三维人脸识别进行了简要的介绍。研究学者们研究用的主流人脸库也做了相应简介。最后对人脸识别中最重要的部分特征提取做了着重的介绍。
第3章主要讲基于PCA的人脸识别算法,首先对该算法涉及到的原理定理一一做了介绍,包括K-L变换原理,SVD定理,以及各种距离函数。然后是对子本次研究的全部内容分条重点介绍,主要有四大块,人脸的表示,特征脸空间的构造,特征提取,人脸识别。并对MATLAB仿真过程及结果分析进行了较为详细的说明。
第4章主要讲了基于PCA的特征提取法和基于FisherFace的特征提取法的比较,简要介绍了FisherFace法的理论基础,并对两种方法的优缺点各自做了说明。综合对比后本次毕业设计决定采用基于PCA的人脸识别算法进行研究。
67
第2章 人脸识别相关技术介绍
第2章 人脸识别相关技术介绍
2.1 系统概述
人脸识别技术是模式识别技术中非常重要的应用方面[6][7],可分为三大方面,一是对人脸的图片进行预处理;二是特征提取;三是比较识别。人脸识别系统一般由以下步骤组成:人脸的检测、人脸的定位、图像的预处理、提取特征、图像训练、图像识别对比等步骤,系统的流程图如下图所示:
预存人脸
图像训 练
特征提取与选择
人脸定位
预处理
人脸定位
图像识 别
特征提取与选择
预处理
待识别人脸
图2-1 人脸识别系统流程图
2.2 人脸识别主要技术
目前人脸识别的算法主要有两大类[8]:二维的人脸识别算法和三维的人脸识别算法。下面分别简要介绍。
2.2.1 二维人脸识别算法介绍
本论文研究的是二维图像的人脸识别算法,该算法通过提取人脸的主要特征进行人脸比对。目前二维人脸比对的方法主要有以下集中:
(1)主成分分析法:该方法一直是模式识别这一领域基础而又重要的方法,也是人脸识别领域的重要算法,此算法首先根据预存的人脸图像来构成特征脸空间
(2)人脸模板匹配法:按维度可分为二维人脸模板和三维人脸模板,主要根据人的脸部特征来构建一个立体并且可调节的人脸模型,在定位到人脸后,就需要用人脸模型来定位和调节人脸的各个特征部位,用来处理识别过程中涉及到的人脸角度、表情变化和遮挡物等因素的影响。
(3)局部投影保持法:该方法是源于子空间分析方法,是非线性方法的线性近似。此方法不仅有能够原始图像非线性流形的优点,又有能够得到新样本点低维度投影的优势。
(4)人脸子空间分析法:该方法已经成为人脸的特征提取的重要方式,也是目前人脸识别的主流。因为其可以对人脸有很强的描述性,而且计算量相对较小,容易实现和可分性较好均是该方法的优点。
除上述提到的四种方法之外,二维的人脸识别算法还有支持向量机法、人工神经网络法、弹性匹配法和基于人脸积分图像特征的方法。
2.2.2 三维人脸识别算法介绍
二维人脸识别算法的识别率容易受到人脸角度变化、遮挡物、表情变化的因素影响。但这些因素都是日常生活常见且不可控的,所以需要研究更加先进的算法,三维人脸识别算法根据深度图像来进行研究,对以上那些因素都能有较好的解决方式。三维人脸识别算法主要有以下两种[9]:
(1)基于人脸模型可变的参数法:利用人脸模型的3D形变以及迭代距离当中映射的最小值来还原出3D的人脸图像和头部的姿势。改变关联的关系还可以更新头部姿态的参数,此过程可用来达到最小化尺度的要求。
(2)基于人脸图像的特征法:要想从人脸的3D结构中把姿态分离出来,就需要计算人脸的三维空间方向,并算出人脸整体的轮廓和尺寸。然后可以通过保持姿态来匹配脸部的特征点。
2.3 常用的人脸图像库
人脸识别技术已成为热门的研究内容,为了方便研究学者的使用,目前国际上有和多家权威的机构构建了标准人脸库,主流的有以下几种[10]。
(1)ORL人脸库,美国的一家专业从事人脸图像研究的实验室拍摄的一组人脸图像,构成的ORL人脸库,参与拍摄的人来自不同的种族、不同的性别、不同的年龄,共计四十个人。每名试验者都拍摄十张图片,图像均为灰度图像,像素是112×92。每个人的十张照片中表情,人脸大小,姿态等都是变化的。该数据库包含了大量的人脸信息,研究起来非常方便。
(2)FERET人脸库,该数据库是最大的人脸数据库,是英国国防部建立的。它里面的人脸图像有着肤色和人脸角度的变化。测试者的背景图像都是统一的,每位都有8张图片,从而可以最大限度的排除外界干扰。本数据库在人脸数据库中是相当权威的,但它的不足是获取图像信息时不是很方便。
(3)Essex人脸库,英国埃塞克斯大学建立了该人脸数据库,并为研究者提供免费的下载,但是不允许发售和打印。计算机视觉研究项目额度负责人Libor Speacek博士负责维护该库。Essex数据库中包含四个库,它们分别是grimace,faces94,faces95,faces96。
其中faces96和grimace是难度非常大的,也是最不容易识别的。因为它们的背景、人脸表情、人脸比例大小都是变化的。
本论文采用的是ORL人脸数据库,库中有二十位测试者的照片,每张图像占内存11.1kb,像素为92×112,格式为bmp格式。每位测试者有六张图片,每张图片均有表情的变化,且有一定的遮挡物,如眼镜等,每位测试者的照片都与正脸有小范围内的倾斜角度。用每位测试者的五张照片组成训练样本库,用另一张作为待识别的人脸库。
2.4 人脸的特征提取
人脸的图像在最初的样本空间中的分布并非集中的,这一点常常不利于用来进行有效的归类识别。为了能区分不同类别的人脸图像,可以把原始的人脸图像转换到另外一个空间中通过线性或者非线性的方法。这样就会使得同类型的人脸图像在空间的分布中更加集中,方便识别和归类。特征提取就是指通过变换或是映射的方法将高维空间的原始特征转换到低维特征空间中,得到低维的人脸特征表示。人脸的特征主要分为两大类,代数特征和几何特征。
2.4.1 几何特征提取法
人脸的几何特征即人脸的器官形状和几何关系为基础的特征矢量,它的分量通常包含人脸指定的两点之间的欧氏距离,角度,曲率等。人脸上典型的几何特征分量有以下几种[11]:
(1)眉毛的弧度
(2)眉毛的厚度以及眉毛对应的眼睛中心处的垂直距离
(3)鼻子的宽度和其垂直位置
(4)鼻子处人脸的宽
(5)鼻尖到眼睛中心位置处的距离,称为半脸宽
(6)嘴的宽度,厚度,垂直位置及其上下唇的厚度
人脸几何特征具有提取速度快,占用内存少的优势。但是在识别的精确度上不如基于代数特征的方法。它对几何参数的测定要求需精确因此在有遮挡物或是人脸图像质量不好的情况下,它的识别率会剧烈下降。所以我们把人脸的代数特征讨论作为重点。本论文也采用的是人脸的代数特征法。
2.4.2 代数特征提取法
人脸图像代数特征的矢量表示即人脸的代数特征,相当于人脸图像在特征脸构成的低维空间上的投影。Kirby等首次将主元分析的子空间思想引进到人脸识别技术当中。并取得了较大的影响。并引起了研究学者们的广泛关注,进而成为了目前人脸识别算法中主流方法之一。
子空间方法的主要思想就是空间变换,根据一定的性能目标去寻找线性的或者非线性的空间变换,将高维的原始信号数据压缩到低维的子空间当中,这样会使得数据的分布更加紧凑一些,为更好的进行数据描述提供了方式。此外还将计算的复杂度大大降低。子空间方法可以分为线性和非线性的子空间发,下面介绍一下线性子空间法。
线性子空间法指空间变换时是线性的,用来将原始的人脸数据压缩到低维子空间当中。常见的有主元分析法、线性判决分析和独立元分析的方法。
主元分析法[12],由于本论文就是基于PCA的人脸识别算法研究,所以在此重点介绍。PCA法的目的是找到一组最优的单位正交向量基即主元,这一过程是通过线性变换来完成的。用这些主元的组合来对原样本进行重建。并要求重建后的样本和原样本之间的误差是最小的。从数学上讲,主元分析法的思想就是通过特征值来对角化协方差矩阵S。
(2-1)
(2-2)
N代表样本的总个数,是所有样本的平均值,特征值需按降序的顺序排列,
,一般情况下选择对应的前m个(m<<n)非零的特征向量来作为主元。这样样本置于特征子空间的位置就可以用低维子空间的投影系数来表示:
(2-3)
通过PCA特征提取即可得到一些比较标准的人脸的特征向量,这些特征向量的线性加权组合就可以用来表征人脸的图像。
Turk和Penland在1991年首次提出了特征脸方法-基于PCA的人脸识别方法[13]。他们在论文中写道,人脸识别中利用主元分析能够得到人脸在低维度空间中的线性表示,而且可以使人脸有较好的可分性质。高维空间中的图像在经过主元分析方法后,就能够得到一组全新的正交基,人脸的低维度空间就是由这些正交基构成的。将这些低维度特征空间下的正交基根据图像阵列去排列,能够明显的看出这些正交基呈现人脸的形状。所以这些正交基得名为特征脸,此人脸识别的方法就叫做特征脸法。
主元分析法中一般是根据对应的特征值的大小来确定选取的主元的优先级。特征值越大,所含信息量越大,就代表其优先的级别越高。在人脸识别中,要想确定最佳主元的数量,有这样两种方式可供选择,一是提取特那些征值比较大的主元,舍弃那些特征值小于某个指定值的主元;二是已经选取好的特征值要占百分之九十总的特征值的和。
主元分析法就是把现有的样本进行一次最优的重构,是针对一个样本,所以对于体现不同类样本差异,达不到最优的情况。以这个角度来说,用主元分析法来对人脸特征进行识别是不够充分的。
线性判决分析,LDA也称为Fisher线性判别,1996年由Belhumenur引进模式识别和人工智能这一领域。LDA的基本思想是将高维度下的模式样本投影到最佳鉴别矢量空间,能够达到提取分类信息和降低特征空间维数的效果。它与主元分析法的区别之处是,LDA是从样本的可分性出发,求得一组线性变换来使得每类内离散程度最小,同时每类类间的离散程度最大。经常用到的是Fisher准则函数,该函数的定义为:
(2-4)
其中和分别为类间离散度和类内离散度为:
(2-5)
要想求解Fisher准则函数,就需要先求解的特征值。但是把LDA应用在人脸识别上,很多情况下没有直接的办法求解Fisher准则函数,都是因为训练样本的数量不能够保证为满秩。为此,有人提出将PCA和LDA结合起来[14][15],也就是先利用PCA来对原始数据样本降低维度,可以得到表示原始样本数据最优特征的子空间。而且类内散布矩阵在这个子空间属于非奇异矩阵,然后可以利用LDA方法继续进行。
独立元分析,ICA理论的基本思想是从一组混合的观测信号中分离出独立的信号,或是尽可能用独立的信号对对其他信号进行表征。ICA是通过线性变换在训练的样本当中寻找到含有高阶统计信息的相互独立的一组基。用它来对样本数据进行描述。PCA是在二阶统计意义下的去相关,而ICA是所有阶统计意义下的去相关。因此求解它很不容易。目前又三种主要方式可用来求解:一是固定点算法;二是信息论法;三是联合近似对角化特征矩阵的方法。三种方法中第一种最为简单快速,它将求解独立元简化为简单的迭代步骤,如下:
(2-6)
(2-7)
ICA算法最早只是运用在信号的分析上,后来才引进到人脸识别技术中,并起到期望的效果,得到了发展。
2.5 本章小结
人脸识别技术涉及到很多方面,图像处理,特征提取,图像识别等过程,每一个过程都有多种主流算法,每一个过程都是重点难点,本文研究主题是基于PCA的人脸识别算法,所以本章首先对人脸识别的主要技术,二维人脸识别算法和三维人脸识别算法做了简要介绍,然后对人脸识别的关键步骤特征提取进行了重点说明,最后简要介绍了当前研究学者们经常用到的主流的人脸图像库。
第3章 基于PCA的人脸识别算法
3.1 引言
特征提取正在人脸识别步骤中占有十分关键的地位,人脸识别的有效性精确性的关键就在于是否可以提取出有效的人脸特征,人脸的构成非常复杂同时还在不断的变化。这是一个高维度下的模式识别问题。寻找到有效的特征是非常困难的。人脸图像进行特征提取主流方法有两种:人脸几何特征提取法和人脸代数特征提取法,在前面的文字中介绍过,几何特征主要是人脸五官之间的几何关系,一般包括角度,欧氏距离和曲率等特征。代数特征提取法其实就是把人脸构建成一个数据矩阵,通过提取矩阵的特征来进行人脸识别,比对。本次论文拟采用代数特征提取法。
一般一张人脸图像的维数是非常高的,这样处理起来的计算量很大,不利于图像的处理。此外在高维空间人脸图像分布集中非常不利于区分。为了区分出人脸图像,引入了主成分分析法,它的主要应用是将高维空间中的主要提取出来,以此解决维数过高的计算量以及数据冗余问题。对人脸图像的特征提取一般指的是将待识别人脸图像投影到特征脸空间。一般来说,投影满足两个条件,第一,人脸的主要信息要保留在特征脸空间中。第二,投影后的图像维数要远远小于投影前的维数。
基于PCA的人脸识别算法,首先应用K-L变换,求出训练人脸空间的特征值,对特征值进行一定的取舍,然后构成一个新的低维正交基空间。我们将所有的人脸投影在这个低维空间中,然后计算与待测图像的人脸最近的人脸图像,上述可分为以下四个阶段[10]
(1)训练人脸数据库,根据待训练的样本图片数据矩阵构造特征脸空间;
(2)把训练的样本图片映射到(1)中构造的特征脸空间上;
(3)把待识别的人脸图片也投影到特征脸空间中;
(4)比较图像在特征脸空间中的距离,输出距离最小的作为识别结果。
在求步骤(1)中的特征脸空间,要用到K-L变换和SVD定理来对数据矩阵进行维度的降低,并经过一定的取舍后,构造出一组新的低维正交基空间。步骤(4)中用到的距离本文采用欧氏距离。
3.2 K-L变换
K-L变换是建立在统计基础上的一种变换,有的文章也称权威主成分变换或是霍特林变换。由于霍特林在1993年最先提出将离散的信号变成一串不相关系数的方法。得到的协方差矩阵除对角线上的其他元素均为零,因此可以知道数据之间是没有相关性的,所以该方法的优点就是去相关性好,在数据的压缩方面起到了相当显著的作用。
3.2.1 K-L变换原理
假设是一个N×1的向量集合,是变量的均值,统计N各样本向量近似为下式[11]
(3-1)
的协方差定义为:
(3-2)
是协方差矩阵的特征值,是协方差矩阵的特征向量,根据下述公式求协方差矩阵的特征向量和特征值。
(3-3)
变换矩阵是特征向量构成的
(3-4)
为正交化后的矩阵,。一维的K-L变换就可定义为下式:
(3-5)
反变换定义为:
(3-6)
在对图像信号进行变换时,为了得到图像矢量,可将其按像素行行排列或者列列排列。像素之间的相关性可以通过矢量之间的相关性体现,建立好矢量信号X后,就要计算协方差矩阵CX,然后计算的特征矢量就能够得到K-L变换矩阵A。
3.2.2 K-L变换性质
(1)变换后的矩阵F均值为0
(3-7)
(2)变换后的矩阵F协方差为0
(3-8)
(3)变换后的矩阵F为对角矩阵
(3-9)
(4)因为是对角矩阵,所以其中各个元素互不相关.
(5)特征值表示特征向量方向上f的第i个元素的方差,由于K-L变换是正交对称的,所以下式成立。
(3-10)
向量信号进行K-L变换后是值是不变的,只是各个分量变换后的值改变了。通常情况下,经过K-L变换后,会出现很多相当小的值。这就意味着,保留主要特征同时又能够降低数据的维数。这一性质就能够运用在数据压缩当中。
主特征分量具有四大性质[15],一是稳定性,如果输入信号发生比较小的变化时,所求得的主要特征只会发生更加微小的变化,这说明图像噪声将不会对其造成比较大的影响。所以输入就可以有更加宽松灵活的范围。二是映射为线性关系,而且矩阵已经正交归一化,训练空间中的每一个模式都有对应的唯一的特征向量。因此可以知道主要信息并不能够随着模式的改变而改变。三是经过映射后,模式之间的距离也会变小,多维空间的分类将变得可能。四是主特征分量是以重建误差最小的原则上构建的,这说明主特征有重构功能,即主特征具备图像重建的能力。主特征数量的多少也决定着重构的图像质量的好坏。
K-L变换就是能够在原始的人脸样本空间中求取一组正交向量,保留其中主要的正交向量构成新的人脸空间。如果人脸图像在这个新的低维度空间的投影具有可分性,这些投影就可作为可识别的特征向量。原始的人脸空间总体散布矩阵的特征向量即为这组正交向量,它们可构成脸的形状,所以得名为“特征脸”。
3.3 SVD定理
SVD定理即奇异值分解定理。人脸复杂度很高,维度也很高,普通矩阵的特征值和特征向量通常可以通过K-L变化来得到,但是人脸图像这种高维度举证求解特征向量很困难,因此需要通过SVD定理来解决此问题。
K为m×n(m>>n)维矩阵,它的秩为R,奇异值A为和的特征值的非负平方根。那么一定存在两个正交矩阵满足下式
(3-11)
可使得
(3-12)
(3-13)
是K的奇异值,令,和的特征向量分别为。
根据SVD定理
(3-14)
的特征向量和特征值可以通过的特征值和特征向量间接求得。
定理1:设K为任意的一幅人脸图像,它的奇异值向量可有如下定义
(3-15)
那么K就可以展开为下式:
(3-16)
定理2:根据式(3-16)很方便得出下述定理对于任意的一幅人脸图像,假设,分别为人脸图片K奇异值分解时对应的左右正交矩阵,那么矩阵是矩阵空间中的最大线性无关组矩阵,即为中的一组基。代表矩阵U的第i列和矩阵V的第j列。
由上述可得以下结论,人脸图像本身决定着其奇异值向量所在的基空间(矩阵)。
根据式(3-16)说明人脸图片可以精确的通过矩阵的线性组合来表示,其中是人脸图片K在这个基空间下的坐标。K的奇异值就是图像K在这个坐标系下对应基矩阵的坐标分量,所以可以得到人脸图像本身决定着其奇异值向量所在的基空间(矩阵)。
经实验可知,把同类图像相互之间的奇异值向量进行交换或是把不同类图像的进行交换,经过重构后,得到的图像均与原图像的类别一致,但是如果保存奇异值不便,而交换非同类图像见的左右正交矩阵,将不能得到原图像类别相同的重构图像。这表明一个问题,在不同类别或相同类别中,人脸图像有可能有相同的奇异值向量。
就本论文采用的ORL人脸库来说,共采用了100张训练人脸图像,待识别人脸图像库有20张图像,每张图像的像素为92×112,那么人脸样本集的训练矩阵维数就有10304×100.,协方差的矩阵维数就有10304×10304。由SVD定理可知,协方差矩阵的特征值和特征向量可通过
展开阅读全文