收藏 分销(赏)

本科毕业设计论文-基于移动窗口的人脸图像识别方法研究.doc

上传人:胜**** 文档编号:2079922 上传时间:2024-05-15 格式:DOC 页数:27 大小:940KB
下载 相关 举报
本科毕业设计论文-基于移动窗口的人脸图像识别方法研究.doc_第1页
第1页 / 共27页
本科毕业设计论文-基于移动窗口的人脸图像识别方法研究.doc_第2页
第2页 / 共27页
本科毕业设计论文-基于移动窗口的人脸图像识别方法研究.doc_第3页
第3页 / 共27页
本科毕业设计论文-基于移动窗口的人脸图像识别方法研究.doc_第4页
第4页 / 共27页
本科毕业设计论文-基于移动窗口的人脸图像识别方法研究.doc_第5页
第5页 / 共27页
点击查看更多>>
资源描述

1、河北大学2009届本科生毕业论文(设计)基于移动窗口的人脸图像识别方法研究摘 要人脸识别是机器视觉和模式识别领域最富有挑战性的课题之一,同时也具有广泛的应用意义。目前在基于正面静态人脸检测与识别、人脸特征的提取等方面已取得了一些可喜的成果。但是,在较复杂的环境下,诸如对人脸表情的识别、光照补偿与光照模型的建立、多种检测数据的融合等方面还缺乏着实有效的方法。 本文介绍了移动窗口,移动窗口广泛应用于图像处理、模式识别和数字信号处理中,它具有数据量大、计算密集等特点。移动窗口针对图像的算法的一般描述是:在规模为 WH 的图像中,按一定规律移动 wh 的窗口(Ww, Hh),对窗口内像素点的像素值进行

2、一系列运算,运算结束后窗口向右或向下移动一步,直到完成对整幅图像的处理。用移动窗口可以使图像边界的细节保持好,处理速度快,从而提高了人脸图像识别的准确率。关键词:人脸识别 移动窗口 人脸特征检测ABSTRACTFace recognition is the field of machine vision and pattern recognition,one of the most challenging issues,but also the meaning of a wide range of applications. Based on the positive static in fa

3、ce detection and recognition,facial feature extraction, such as there has been some encouraging results. However, in more complex circumstances, such as facial expression recognition, compensation and light illumination model, the integration of a variety of test data, etc. is also a lack of really

4、effective method.In this paper, moving window is widely used in image processing, pattern recognition and digital signal processing, it has a large amount of data, computing-intensive and so on. Moving window for the image of the general description of the algorithm is: in terms of size W H for the

5、image, according to a certain law of w h moving window (W w, H h),on the window of the pixel value of pixels a series of operations, operations after the end of the window or down a step to the right until the completion of the whole image processing. Moving window can be used to make the details of

6、 the image border to maintain a good,fast processing speed, resulting in improved facial image recognition accuracy.Key words: Face recognition MovingWindow Facial feature detection 目 录一 引言11.1人脸图像识别的研究背景及意义11.2人脸图像识别研究的状况和进展11.3研究内容21.4论文组织结构3二 人脸图像识别技术及其常用方法42.1人脸识别技术42.1.1静态人脸检测52.1.2动态人脸检测62.2基于

7、整体特征的提取方法62.3人脸识别方法6三 基于移动窗口的人脸图像识别103.1基本原理103.2移动窗口分类器方法103.3位平面分解103.4基于移动窗口的人脸识别流程11四 基于移动窗口的人脸识别系统的设计与实现134.1方案设计134.2用户界面设计134.3模块设计144.4人脸识别算法的实现144.4.1bmp文件结构介绍144.4.2图像预处理154.4.3图像大小标准化174.4.4预处理算法17五 实验结果及分析195.1运行环境195.2人脸图像样本库195.3测试结果20六 总结21谢 辞22谢 辞22参考文献23一 引言1.1人脸图像识别的研究背景及意义 计算机人脸识别

8、技术是生物特征识别技术的一种。目前进行身份鉴别所依赖的生物特征主要有两类,一类是身体特征,一类是行为特征。人脸识别与其他的身份识别方法相比较,它的应用过程是非接触式的、连续的和实时的,因此更加直接、友好,使用者不会有心理障碍,并且通过对人脸的表情和姿势进行分析,还能获得其他很多很难获得的信息,这些优势使人脸图像识别在这么多生物特征识别技术中很受重视。近年来,微电子技术、计算机技术发展神速,数字图象技术也因此受到影响,进而推动了人脸图像识别的发展,使得人脸图像识别在技术上与经济上有了进一步的发展。人脸图象识别技术,前景非常广阔。据称,1992年在美国身份鉴别产品获60亿美元的收益。在美国、英国、

9、日本、以色列、印度等国的大公司,军警方正加紧这方面的研究工作,我国的研究工作也已开始。当前的人脸识别技术主要被应用到了以下几个方面:1、刑侦破案 公安部门在档案管理系统中存储了大量嫌疑犯的照片,如果在某种情况下获得了某一个嫌疑犯的照片或者他面部的某些特征,就可以从数据库中进行比对查找,这就对刑侦破案工作有了贡献,使破案速度更快准确性更高。2、证件验证 在诸如海口,机场,重要考试的考场等人数繁多的场合,证件验证就成为检验人们身份的一种常用手段,而身份证,驾驶证等很多带有照片的证件使用人脸识别技术,就可以由机器完成验证识别工作。3、视频监控 在许多大的公司,公共场所等处都设有视频监控。当有异常情况

10、发生或有陌生人进入时,就要采取实时跟踪,监控,识别和报警等措施。这些都需要对采集到的图像进行具体分析。此外,人脸识别技术在医学,档案管理,人等方面也有着非常重要的作用。1.2人脸图像识别研究的状况和进展 国外关于人脸识别的研究已经有很多年,近期已经有一些人脸识别算法应用于商业产品中,并且得到了应用。我国有关于人脸自动识别的研究最早始于二十世纪80年代,主要的研究单位有清华大学,哈尔滨工业大学,中科院计算所,中科院自动化所,复旦大学,北京科技大学等,并都取得了一定的成果。国内的研究工作主要是集中在三大类方法的研究:基于几何特征的人脸正面自动识别方法、基于代数特征的人脸正面自动识别方法和基于连接机

11、制的人脸正面自动识别方法。周激流实现了具有反馈机制的人脸正面识别系统,运用积分投影法提取面部特征的关键点并用于识别,获得了比较满意的效果。他同时也尝试了一些稳定的特征提取方法,他对人脸侧面剪影识别做了一定的研究,并实现了正、侧面互相参照的识别系统。彭辉、张长水等对“特征脸”的方法做了进一步的发展,提出采用类间散布矩阵作为产生矩阵,进一步降低了产生矩阵的维数,在保持识别率的情况下,大大降低了运算量。程永清,庄永明等对同类图像的平均灰度图进行分解得到特征脸空间,每一幅图像在特征脸空间上的投影作为其代数特征,然后利用层次判别进行分类。张辉,周洪祥,何振亚采用对称主元分析神经网络,用去冗余和权值正交相

12、结合的方法对人脸进行特征提取和识别。该方法所用特征数据量小,特征提取运算量也较小,比较好地实现了大量人脸样本的存储和人脸的快速识别。北京科技大学的王志良教授主要研究人工心理,建立了以数学公式为基础的心理学模型。国内在此方面的研究发展很快,也有一些工作已经或正在转化为商品软件,在orl标准人脸库的实验结果表明,在普通的分类器下分别达到了95.5%和99.4%的识别率1。尽管人脸识别技术有着广阔的应用前景,但是就目前而言,人脸识别的效果并不很好,归根结底,影响人脸识别效果的原因主要有以下的几个方面:1、人脸图像的获取过程中由于光照光强的不确定性而造成了图片清晰度的差异。2、人脸并非来自同一个人,每

13、个人都有着不同的脸部模式和脸部特征。3、不同的人脸又有着千变万化的面部表情。正因为在人脸识别的过程中存在着上述的各种各样的品种繁多的问题,因此在实际的检测过程和识别过程当中,如果遇到这些因素中的某两个或者更多个叠加到一起的情况,情况就变得更加复杂。基于几何特征的识别方法,其存在的主要问题在于没有形成一个统一的,优秀的特征提取标准。在描述人脸的时候受到表情、光照、姿态的影响比较大,无法准确地描述人脸特征。尽管如此,基于几何特征的方法在处理人脸表情分析时,仍然是一个最有效的依据。同时,目前已经提出了很多改进的特征提取的算法,使得人脸几何特征的提取越来越趋于合理,这里面最具代表性的方法就是结合人脸信

14、息的特征点提取技术。基于代数特征的识别方法是目前在实际应用中使用得最多的一类方法,其主要原因是由于代数特征矢量即人脸图像在特征空间的投影结果对角度,表情等因素都具有一定的稳定性。但对于光照而言,似乎效果并不太明显。这种代数的特征识别方法,无法应用于人脸的表情识别。从某种意义上来说,人脸识别的各种方法,实际上就是在寻找一种人脸的描述方式,但是要找到一种能够不受各种因素影响的描述方式非常地困难,无论是最早使用的几何描述方式以及后来比较常用的代数描述方式,都不可避免地存在各种干扰。我们只能是在以后的研究中,逐渐去完善人脸的描述方式,使之更加有效,更加准确。1.3研究内容 图像处理在日常生活和科学研究

15、各个方面有广泛应用,其中有一类算法有移动窗口的特点。即对图片里一个窗口内的像素点进行处理,处理结束后将窗口滑动到新的位置,再处理,直到处理完整幅图像。这类算法有着广泛的应用,比如边缘检测。本文就是介绍了这种移动窗口,移动窗口广泛应用于图像处理、模式识别和数字信号处理中,它具有数据量大、计算密集等特点。移动窗口针对图像的算法的一般描述是:在规模为 WH 的图像中,按一定规律移动 wh 的窗口(Ww, Hh),对窗口内像素点的像素值进行一系列运算,运算结束后窗口向右或向下移动一步,直到完成对整幅图像的处理。用移动窗口可以使图像边界的细节保持好,处理速度快,从而提高了人脸图像识别的准确度。1.4论文

16、组织结构 本文在第一部分介绍了人脸识别研究的背景,意义,研究现状和研究内容,又在第二部分中提到了人脸图像识别研究的状况、进展,此外还有人脸识别技术的常用方法,重点在第三部分讲解了移动窗口人脸图像识别的基本原理,第四部分介绍了人脸识别系统的设计与实现,包括方案设计,界面设计,数据库设计和模块设计。最后两部分对本文稍做了一个总结。二 人脸图像识别技术及其常用方法2.1人脸识别技术 一个典型的人脸识别系统都由图2-1所示的几个部分组成:图2-1 典型的人脸识别系统下面分别阐述各部分的功能和作用:图像获取这一部分主要负责获取图像,但图像可以有不同的来源,比如:图像可能来自于摄像机,但图像也可能来自于扫

17、描仪等设备,这样获得图像以后人脸识别程序就自动将这幅获得的图片经过预处理转化为可处理的格式。检测定位部分则通过对之前输入的图像进行进一步的处理分析,判断该幅图像中是否存在人脸,若图像中确实存在人脸,那么就针对于这个人脸做出准确的定位。但是由于图像所处的环境有所不同,你如说是静态还是动态,是彩色的还是黑白的,光线比较强还是光线比较弱等等。正是因为这些因素的存在所以我们在处理时也是有所不同的。由此可见这一阶段的工作的重要性,因为它直接影响到后面检测的准确程度,失之毫厘,谬以千里,所以在这一阶段应该格外的认真、谨慎。正规化部分也可以叫做预处理部分,即将之前抽取的人脸图像进行调整,使它们的大小和亮度统

18、一。特征提取部分是在前面正规化后的人脸图像中按照某种策略抽取特征,而这部分特征就是用来进行识别的,将原始的脸空间中的数据映射到特征空间。因为最原始的图像数据量是非常大的,为了分类识别能够有效地进行,就要对原始数据进行变换,得到最能反映分类本质的特征。一般把原始数据组成的空间叫测量空间,把分类识别赖以进行的空间叫特征空间,通过变换,可把在维数较高的测量空间中表示的模式变为在维数较低的特征空间中表示的模式。在特征空间中的模式通常也叫做一个样本,即特征空间中的一个点。分类器设计部分是在后台进行的,就是训练过程,此过程结束后将生成可用于分类识别的分类器。事实上,模式识别问题可以看成一个分类问题,即把待

19、识别的对象归到某一类中。在人像识别问题中,就是把输入的不同的人像归入某个人这一类。这部分的基本做法是在样本训练集基础上确定某个人这一类。在人像识别问题中就是把输入的不同的人像归入某个人这一类。这部分的基本做法是在样本训练集基础上确定某个判决规则,使按这种判决规则对被识别对象进行分类所造成的错误识别率最小或引起的损失最小。分类决策部分就是利用已设计好分类器作分类识别,给出最后的识别结果,并做出相应的判断。基础图像处理部分包括一些最基本的图像操作,为检测定位部分和正规化部分提供必要的服务,比如检测定位部分常常需要对图像进行边缘提取,二值化等操作;正规化部分常需要进行图像的灰度归一等操作2。人脸识别

20、技术的处理流程图如图2-2所示:图2-2 典型的人脸识别流程图2.1.1静态人脸检测 基于统计的人脸检测方法:1、基于变换的方法:主要思想是将处于高维的原始数据空间转换为低维数据空间。其中在人脸识别中利用主元子空间,人脸检测则利用的是次元子空间。用待检测区域在次元子空间上投影,即将待检测区域到变换子空间的距离作为检测统计量,距离越小就越像人脸。2、基于神经网络的方法:主要思想是把人脸检测分为非人脸样本与人脸样本进行模式分类。通过对人脸样本集和非人脸样本集进行学习产生分类器。人工神经网络是目前国际上广泛采用的一种方法,更普遍的是基于BP神经网络训练算法在人脸检测中的应用。3、基于概率模型的方法:

21、有两种实现思路,一种基于贝叶斯分类器的方法,一种基于后验概率估计的方法,通常利用贝叶斯原理将后验概率估计转化为一个似然度来求解;另一种概率模型是隐马尔可夫模型(HMM),它具有健壮的数学结构和时序模式分类能力,常被应用于人脸检测和人脸识别。2.1.2动态人脸检测动态人脸检测的思路可以归结为四类。1、基于彩色信息:利用人脸彩色信息,提取人脸特征中相对固定不变的颜色信息进行人脸检测。2、基于运动信息:充分利用运动连续性进行图象在连续帧间的跟踪。3、基于人脸局部特征的方法:根据不同的人脸器官特征信息进行跟踪。4、基于参数模型或模板:获取目标的先验知识从而建立低价参数模型,对输入的每一帧图象通过移动窗

22、口进行模型匹配,实现人脸跟踪。2.2基于整体特征的提取方法通常情况下,形状特征有两类表示方法,一类是轮廓特征,另一类是区域特征。图像的轮廓特征主要针对物体的外边界,而图像的区域特征则关系到整个形状区域。几种典型的形状特征描述方法:1、边界特征法通过对边界特征的描述获取图像的形状参数。其中 Hough变换检测平行直线方法和边界方向直方图方法是经典方法。Hough 变换是利用图像全局特性而将边缘像素连接起来组成区域封闭边界的一种方法,其基本思想是点线的对偶性;边界方向直方图法首先微分图像求得图像边缘,然后,做出关于边缘大小和方向的直方图,通常的方法是构造图像灰度梯度方向矩阵。2、傅里叶形状描述符法

23、傅里叶形状描述符基本思想是用物体边界的傅里叶变换作为形状描述,利用区域边界的封闭性和周期性,将二维转化为一维。 3、几何参数法形状的表达和匹配采用更为简单的区域特征描述方法,例如采用有关形状定量测度如面积、周长等的形状参数法。在其他一些系统中,便是利用圆度、偏心率、主轴方向和代数不变矩等几何参数,进行基于形状特征的图像检索。 4、形状不变矩法利用目标所占区域的矩作为形状描述参数。 5、基于小波和相对矩的形状特征提取与匹配该方法先用小波变换模极大值得到多尺度边缘图像,然后计算每一尺度的 7个不变矩,再转化为 10 个相对矩,将所有尺度上的相对矩作为图像特征向量,从而统一了区域和封闭、不封闭结构3

24、。2.3人脸识别方法常用的人脸识别方法主要有基于几何特征的方法、基于神经网络的方法,基于模板匹配的方法,特征脸方法,隐马尔可夫模型的方法和弹性图匹配方法。下面一一介绍:第一种是基于几何特征的方法。基于集合特征的方法是最早、最传统的方法,通常需要和其他算法结合才能有比较好的效果。这种方法首先将人脸表示成一个几何特征矢量,用层次类聚思想设计分类器,然后继续识别。根据不同积分投影产生的波的不同状态来得出人脸中各部分的几何位置关系。虽然这种方法易于理解,存储量小,但它一般只注重人脸各部件的关系而忽略了局部细微的特征。在这种方法中通常利用一个函数进行度量,这个函数就是特征矢量之间的距离函数。S=1-(|

25、Xj-Rj|/Rj) (2-1)其中,Xj表示待识别特征矢量第j个分量,Rj表示样本库中的特征矢量第j个分量。Wj是加权系数,有这个公式计算的结果与给定的一个阈值T相比较,如果所得结果大于阈值T,就说明是同一人。第二种是基于神经网络的方法。基于神经网络的方法是以大量神经元为节点,实现单元之间权值互联的拓扑结构。主要有三种结构:第一种结构是神经网络对所有的已知人脸建立;第二种结构是神经网络为单独个人建立;第三种结构是对每两个人建立神经网络。神经网络方法在一定程度上避免了特征提取过程的复杂性。第三种是基于模板匹配的方法。基于模板匹配的方法是用两幅图像进行比较,看二者的匹配程度,使用归一化相关。虽然

26、这种方法要求目标图像要在相同的取向,光照下,预处理过程比较复杂,但它的识别效果还是优于几何特征法。第四种方法是特征脸方法。特征脸方法是一种最常见的识别方法,它的实质就是抽取代数特征,即经过数字变换得到的特征。PCA方法就是一种常用的方法,实质上就是进行KL变换得到一组新的正交基。图2-3 人脸表情识别流程图第五种是隐马尔可夫模型(Hidden Markov Model)的方法。这种方法提供了描述复杂现象的一种可能机制。是一个双重随机过程。节点表示状态,有相变表示状态之间的转移,一个状态可以具有特征空间中的任意特征,对同一特征,不同状态表现出特征的概率不同。图2-4 隐马尔可夫模型的识别方法框图

27、 第六种是弹性图匹配方法。这是一种基于动态链接结构的方法。将图像间的比较转变为网格之间的比较。对于网格上的每一点抽取特征信息,形成一组特征矢量。并用这些特征矢量来代表图像进行匹配。一幅艺术图片 其特征模板图 完成匹配的弹性图 图2-5 弹性图匹配方法示意4 在实际应用当中除了上述提到的几种方法以外,LDA(Linear Discriminant Analysis)方法即线性判别分析法也是经常用到的。这种方法实际上是对离散度进行的一种运算,就是要找到使类间离散度和类内离散度比值最大的那一系列特征。因为类间离散度可以表示成Ai=(ni-n)( ni-n)T, 类内离散度可以表示为Aw=(x* ni

28、) (x* ni) T,其中Pi是先验概率,ni是Bi的均值,n是所选的所有样本的均值。所以 A= 所求出的向量A就是所求的比值最大时所对应的向量。三 基于移动窗口的人脸图像识别3.1基本原理图像处理在日常生活和科学研究各个方面有广泛应用,如条码识别、电子警察,人脸检测。图像处理应用中有一类算法具有移动窗口的特点,即对图片立一个窗口内的像素点进行处理,处理结束后将移动窗口移动到新的位置,再处理,直到处理完整幅图像。移动窗口广泛应用于图像处理、模式识别和数字信号处理中,它具有数据量大、计算密集等特点。移动窗口针对图像的算法的一般描述是:在规模为 WH 的图像中,按一定规律移动 wh 的窗口(Ww

29、, Hh),对窗口内像素点的像素值进行一系列运算,运算结束后窗口向右或向下移动一步,直到完成对整幅图像的处理。 3.2移动窗口分类器方法移动窗口分类是一种改进的确定的正元组分类。在N元组分类器中,是从同一空间模式选择多个不同的N元组。从这个空间里每个N元组又可以获得一个特征点。对于分类器而言,这个空间是分配给色彩特征相仿的类的。因此,在训练过程中,需要计算不同的点从独立的N元组中出现的次数。为了确保所有类的可能性是同等的,并且所有计数都是正常的,因此,每个类出现的最大概率还是相同的。在移动窗口分类器中,窗口比规定的图像小,并且从这个窗口里,只有图像的一部分是可见的。N元组是与窗口紧密相连的,并

30、且分配数量,就相当于每个独立的类出现的可能性。然后窗口移动并且一个新的区域从这个窗口中被划分得到。因此,该窗口是从左向右自上而下以单一的像素位移步骤移动的,直到整个图像被覆盖,并且进行了所有不同窗口的分类。决定性的阶段是把所有不同类点连接在一块,相应的,对这个图像做一个类标志代表所有的,可以从中获得进一步的信息。3.3位平面分解每个典型的N元组所需的内存空间大小记为一个单位,以灰度值和空间大小表示。可以很明显的看到这是很大量的灰度值。有几项措施可以缓解一下对空间的巨大要求。其一就是使用稀疏矩阵,但这会降低处理速度。另一种是降低灰度值,虽然256级很常见,但是选择一个合适的阈值仍然可以对图像进行

31、识别。但是,过多的减少,可对信息造成重大损失,这往往会带来不利的影响。位平面分解虽然只介绍了Schwarz的数据压缩手段,但还可以用来处理N元组所面临的内存空间问题。其基本思想是将图像分解进行二值化,这样也不会丢失任何载于原始图像的信息。对灰度图像在进行二值化,因此不同的灰度图像就会由不同的二进制代码表示。因此收集所有二进制编码代表的灰度图像。3.4基于移动窗口的人脸识别流程基于移动窗口的人脸图像识别的流程图如图3-1所示:图3-1 基于移动窗口的人脸图像识别的流程图通过上图可知基于移动窗口的人脸图像识别流程:启动机器进入人脸识别系统界面,从文件菜单中打开要识别的图片,接着将图片变成灰色,实现

32、图片对比度增强,二值化等一系列预处理,将处理好的人脸图片进行定位,标出眼睛、鼻尖和嘴。接着对完成上述操作的图片进行特征提取,然后点击“识别”,显示结果,之后退出。基于移动窗口的人脸识别的过程可以简单描述为:第一步:将待识别的人脸部的图像和平均脸的图像比较,然后将平均脸的图像减去,这样就可以得到了一个差值向量,记为A,并将这个向量再继续进行两次投影变换,并从中得出效果最好的分类特征。第二步:将等待识别的人脸区分别与样本库中的人脸比较,找到最相近的,计算出最小的欧几里德距离。欧几里德距离即各维内积之和的开方,简而言之就是两点之间的直线距离。第三步:首先判断是否为人脸,这是由分类规则决定的,如果是人

33、脸并且是数据库中的人脸,则进一步判断属于哪一类。四 基于移动窗口的人脸识别系统的设计与实现 4.1方案设计系统总体包含的两个步骤如图4-1所示:步骤一:检测 步骤二:识别图4-1 人脸图像识别系统包含的两个步骤4.2用户界面设计 用户界面包括了所有的模块,如图4-2所示:图4-2 人脸识别系统界面4.3模块设计基于移动窗口的人脸识别硬件系统主要包括四个模块:图像采集模块、图像处理模块、算法识别模块和数据输出模块。其中图像处理模块中又包括光线补偿,灰度变换,对比度增强,二值化等子模块。对图像进行灰度变换的过程实际上就是把彩色的图像转化成黑白的。因为当图像变成黑白色,脸部的信息就能更明显的表示出来

34、。4.4人脸识别算法的实现4.4.1bmp文件结构介绍1、颜色表 颜色表是用来说明位图中的颜色的,它包含有很多个表项,每一个表项是一个RGBQUAD类型的结构,定义一种颜色。RGBQUAD结构的定义如下:typedef struct tagRGBQUAD BYTErgbBlue;/ 蓝色的亮度(值范围为0-255) BYTErgbGreen;/ 绿色的亮度(值范围为0-255) BYTErgbRed;/ 红色的亮度(值范围为0-255) BYTErgbReserved;/ 保留,必须为0 RGBQUAD;颜色表中RGBQUAD结构数据的个数有biBitCount来确定:当biBitCount=

35、1,4,8时,分别有2,16,256个表项;当biBitCount=24时,没有颜色表项。位图信息头和颜色表组成位图信息,BITMAPINFO结构定义如下:typedef struct tagBITMAPINFO BITMAPINFOHEADER bmiHeader; / 位图信息头 RGBQUAD bmiColors1; / 颜色表 BITMAPINFO;2、位图数据 位图数据记录了位图的每一个像素值,记录顺序是从左到右,扫描行是从下到上。位图的一个像素值所占的字节数: 当biBitCount=1时,8个像素占1个字节;当biBitCount=4时,2个像素占1个字节;当biBitCount

36、=8时,1个像素占1个字节;当biBitCount=24时,1个像素占3个字节;Windows规定一个扫描行所占的字节数必须是4的倍数即以long为单位,不足的以0填充,一个扫描行所占的字节数计算方法:DataSizePerLine= (biWidth* biBitCount+31)/8; / 一个扫描行所占的字节数DataSizePerLine= DataSizePerLine/4*4;字节数必须是4的倍数位图数据的大小(不压缩情况下):DataSize= DataSizePerLine* biHeight5;4.4.2图像预处理 /对图像进行灰度化处理 class GrayMatrix p

37、ublic static void gray(String source, String result) try BufferedImage src = ImageIO.read(new File(source);int width = src.getWidth();int height = src.getHeight();ColorSpacecs=ColorSpace.getInstance(ColorSpace.CS_GRAY);ColorConvertOp op = new ColorConvertOp(cs, null);src = op.filter(src, null);getPi

38、xArray(src,width,height);ImageIO.write(src, JPEG, new File(result);catch (IOException e)e.printStackTrace();private static void getPixArray(Image im,int w,int h)int pix=new intw*h;int matrix=new intw*h;PixelGrabber pg=null;trypg = new PixelGrabber(im, 0,0,w,h,pix,0,w);if(pg.grabPixels()!=true)trythr

39、ow new java.awt.AWTException(pg error+pg.status();catch(Exception eq)eq.printStackTrace(); catch(Exception ex)ex.printStackTrace();GetImageRGB(pix,matrix,h,w);/return pix;public static void GetImageRGB(int ImageSource,int ImageDestination,int ImageHeight,int ImageWidth)ColorModel colorModel=ColorMod

40、el.getRGBdefault();int i ,j,k,r,g,b;for(i = 0; i ImageHeight;i+)for(j = 0;j ImageWidth;j+)k = i*ImageHeight+j;r = colorModel.getRed(ImageSourcek);/g = colorModel.getGreen(ImageSourcek);/b = colorModel.getBlue(ImageSourcek);/将R、G值左移,并保存RGB值 /ImageDestinationk =0xFF000000 | ( r 16 ) | ( g 8 ) | b ); I

41、mageDestinationk=r; for(int i1=0;i1ImageDestination.length;i1+) if (i1%ImageHeight=0) System.out.print(n);else System.out.print(ImageDestinationi1+ ); /如果要将彩色图像转换为灰度图像,则先使用如下灰度变换公式: / int gray=r0.3g0.59b0.11;/然后,令r=g=b=gray即可。 /读取黑白图像灰度值/黑白图像灰度值的读取比较简单,只需读取R分量的值: /int gray=getRed( int pixel )6; /* *

42、/* * param args*/ 4.4.3图像大小标准化 由于我们接收到的图像一般大小不等,尤其是有的人脸照的大,有的人脸照得,这就需要对人脸的图像大小进行标准化,因此需要对图像进行放大或者缩小的变换。而在图像缩放变换中,普遍使用的方法是双线性插值算法来进行图像的旋转或者缩放变换7。4.4.4预处理算法 人脸识别过程当中非常重要的一个环节就是预处理。首先要做的就是输入图像。但是通常由于图像获取时所处的环境不同,比如说光照有明有暗,而且设备性能也有优劣之分,另外还存在有噪声,对比度等等一系列的因素。加之距离的远近,焦距的大小不等等因素又使得人的脸部在整幅图像中的大小和位置不确定。所以为了获得

43、大小、位置和质量都适中的图像,就必须对图像进行预处理8。 人脸图像的预处理主要包括人脸扶正,人脸图像的增强,以及归一化等工作。人脸扶正是为了得到人脸位置端正的人脸图像;图像增强是为了改善人脸图像的质量,不仅在视觉上更加清晰图像,而且使图像更利于计算机的处理与识别。归一化工作的目标是取得尺寸一致,灰度取值范围相同的标准化人脸图像。下面简单介绍一些预处理的方法。1、直方图均衡:直方图是一种点操作,它逐点改变图像的灰度值,尽量使各个灰度级别都具有相同的数量的像素点,使直方图趋于平衡。直方图均衡可以使输入图像转换为在每一个灰度级上都有相同像素点数的输出图像(即输出的直方图是平的)。这对于图像比较或分割

44、是十分有用的。设图像有N个灰度级,M个像素点,ha(n)是输入图像a (x ,y)的直方图,图像b (x, y)是输入图像直方图均衡后的输出2、中值滤波:无论是直接获取的灰度图像,还是由彩色图像转换得到的灰度图像,里面都有噪声的存在,噪声对图像质量有很大的影响。进行中值滤波不仅可以去除孤点噪声,而且可以保持图像的边缘特性,不会使图像产生显著的模糊,比较适合于实验中的人脸图像。中值滤波是一种非线性的信号处理方法,因此中值滤波器也就是一种非线性的滤波器9。中值滤波器最先被应用于一维信号的处理中,后来被人们引用到二维图像的处理中来。中值滤波可以在一定程度上克服线性滤波所带来的图像细节模糊,而且它对滤

45、除脉冲干扰和图像扫描噪声非常有效。中值滤波一般采用一个含有若干个点的滑动窗口,将窗口中各点灰度值的中值来代替指定点(一般是窗口的中心点)的灰度值。如果窗口中有奇数个元素,中值取元素按灰度值大小排序后的中间元素灰度值。如果窗口中有偶数个元素,中值取元素按灰度值大小排序后,中间两个元素灰度的平均值。因为图像为二维信号,中值滤波的窗口形状和尺寸对滤波器效果影响很大,不同图像内容和不同应用要求往往选用不同的窗口形状和尺寸。3、归一化:人脸图像的归一化,目的是使不同成像条件(光照强度,方向,距离,姿势等)下拍摄的同一个人的照片具有一致性。人脸归一化包括两个方面的内容:一是几何归一化,二是灰度归一化。几何

46、归一化也称为位置校准,它将有助于矫正因成像距离和人脸姿势变化造成的尺寸差异和角度倾斜。它的目的在于解决人脸尺度变化和人脸旋转问题。具体包括人脸尺度归一化,平面人脸旋转矫正(歪头),深度人脸旋转矫正(扭脸)三个环节。严格的深度人脸旋转矫正需要利用人脸的3D模型。灰度归一化用来对不同光强,光源方向下得到的人脸图像进行补偿。以减弱单纯由于光照变化造成的图像信号的变化10。五 实验结果及分析5.1运行环境操作系统:Microsoft Windows XP开发语言:java5.2人脸图像样本库在人脸识别中,我们用ORL人脸库。ORL人脸库中共有40个人的人脸图像,每人10幅,总共400幅人脸图像。它们是在英国剑桥大学拍摄的,是目前国际上最通用的人脸识别数据库。照片拍摄时间从1992年4月到1994年4月,有在一定范围内的光照变化,面部表情变化包括有无微笑,闭眼,和其他变化如戴眼镜或不戴眼睛。所有照片都是在黑色背景下的正面直立照片。并且有在一定范围内的头部转动,转动角度一般不超过45度,图像大小为92*112的256级灰度图像。ORL数据库中的部分人脸图像如图5-1所示:图5-1 ORL

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 毕业论文/毕业设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服